PubMed-Baseline + Updates herunterladen & synchronisieren
English
Deutsch
In unserem vorherigen Beitrag PubMed-Baseline-Daten mit rsync herunterladen haben wir gezeigt, wie Sie die Baseline-Daten von PubMed aktualisieren können. Dieses Dataset wird nur jährlich aktualisiert - Sie können jedoch die Update-Dateien herunterladen, die typischerweise einmal pro Tag aktualisiert werden.
Die Befehle zum Herunterladen & Synchronisieren beider Dateigruppen in das PubMed-Verzeichnis:
download_pubmed_rsync.sh
rsync -Pav --delete ftp.ncbi.nlm.nih.gov::pubmed/baseline/\*.xml.gz PubMed/
rsync -Pav --delete ftp.ncbi.nlm.nih.gov::pubmed/updatefiles/\*.xml.gz PubMed/Die Option --delete stellt sicher, dass Dateien, die auf dem Server gelöscht wurden, auch lokal gelöscht werden. Wenn beispielsweise ein neues Baseline-Dataset veröffentlicht wird, müssen Sie die Dateien des alten Jahres löschen, um zu vermeiden, dass Sie doppelte Daten verarbeiten müssen.
Check out similar posts by category:
Bioinformatics, C/C++
If this post helped you, please consider buying me a coffee or donating via PayPal to support research & publishing of new posts on TechOverflow