PubMed-Baseline + Updates herunterladen & synchronisieren

English Deutsch

In unserem vorherigen Beitrag PubMed-Baseline-Daten mit rsync herunterladen haben wir gezeigt, wie Sie die Baseline-Daten von PubMed aktualisieren können. Dieses Dataset wird nur jährlich aktualisiert - Sie können jedoch die Update-Dateien herunterladen, die typischerweise einmal pro Tag aktualisiert werden.

Die Befehle zum Herunterladen & Synchronisieren beider Dateigruppen in das PubMed-Verzeichnis:

download_pubmed_rsync.sh
rsync -Pav --delete ftp.ncbi.nlm.nih.gov::pubmed/baseline/\*.xml.gz PubMed/
rsync -Pav --delete ftp.ncbi.nlm.nih.gov::pubmed/updatefiles/\*.xml.gz PubMed/

Die Option --delete stellt sicher, dass Dateien, die auf dem Server gelöscht wurden, auch lokal gelöscht werden. Wenn beispielsweise ein neues Baseline-Dataset veröffentlicht wird, müssen Sie die Dateien des alten Jahres löschen, um zu vermeiden, dass Sie doppelte Daten verarbeiten müssen.


Check out similar posts by category: Bioinformatics, C/C++