Ziel dieser Anwendung ist der Export relevanter anonymisierter Patientendaten und Daten zu Tumorproben aus Onkostar, damit diese in eine bayernweite cBioportal Installation importiert werden können.
Der Parameter --help
zeigt folgenden Hilfetext an
Usage: os2cb <command>
A simple tool to export data from Onkostar into TSV file format for cBioportal
Flags:
-h, --help Show context-sensitive help.
-U, --user=STRING Database username
-P, --password=STRING Database password
-H, --host="localhost" Database host
--port=3306 Database port
--ssl="false" SSL-Verbindung ('true', 'false', 'skip-verify', 'preferred')
-D, --database="onkostar" Database name
--patient-id=PATIENT-ID,... PatientenIDs der zu exportierenden Patienten. Kommagetrennt bei mehreren IDs
--id-prefix="WUE" Zu verwendender Prefix für anonymisierte IDs. 'WUE', wenn nicht anders angegeben.
--all-tk Diagnosen: Erlaube Diagnosen mit allen Tumorkonferenzen, nicht nur Diagnosen mit MTBs
--no-anon Keine ID-Anonymisierung anwenden. Hierbei wird auch das ID-Prefix ignoriert.
Commands:
export-patients Export patient data
export-samples Export sample data
export-xlsx Export all data into Excel file
preview Show patient data. Exit Preview-Mode with <CTRL>+'C'
Als Alternative zu "--patient-id=" kann auch "--oca-plus" angegeben werden, um alle Patienten mit OCAPLus-Panel einzuschließen.
Zusätzliche Optionen für die Befehle export-patients
und export-samples
--filename=STRING Exportiere in diese Datei
--append An bestehende Datei anhängen
--csv Verwende CSV-Format anstelle TSV-Format (UTF-16 und Trennung mit ';' zur Verwendung mit MS Excel)
Wird das Passwort nicht als Parameter angegeben, so wird im Anschluss danach gefragt.
Die Dateien werden als TSV-Datei (durch Tabulator getrennt) und UTF-8 kodiert gespeichert, damit ein Datenimport mit cBioportal ohne Umlautprobleme erfolgen kann.
Für den Export im CSV-Format wird zur Kompatibilität mit MS Excel der UTF-16 Zeichensatz verwendet. Das Trennzeichen ist dabei ;
.
Es handelt sich daher nicht um eine CSV-Datei nach RFC 4180.
Generell verwendet die Anwendung nur Diagnosen, denen ein MTB (Tumorkonferenz mit Typ "27") zugeordnet ist.
Der Standardwert kann - bei Bedarf entsprechend der lokalen Onkostar-Installation - auch mit dem Parameter --mtb-type
überschrieben werden.
Mit der Option --all-tk
werden alle Diagnosen berücksichtigt, denen eine beliebige Tumorkonferenz zugeordnet ist.
Proben-IDs aus Würzburg werden in der Form A/2024/1234
dokumentiert und von der Anwendung in das Format A24-1234
gewandelt.
Die angegebenen IDs der Patienten als auch ermittelten IDs der Proben werden anonymisiert.
Dazu werden aus einer ID ein SHA256-Hash gebildet und von diesem die ersten 10 Zeichen zuzüglich Prefix WUE_
für den
Export verwendet.
Dies entspricht folgendem Shell-Befehl:
echo -n "<ID>" | sha256sum | sed -e 's/^\(.\{10\}\).*/WUE_\1/'
Der Prefix einer anonymisierten ID kann über den Parameter --id-prefix
verändert werden. Ohne Angabe wird "WUE" verwendet.
Mit der Option --no-anon
kann die Anonymisierung deaktiviert werden.
Achtung: IDs von Patienten und Proben werden direkt ausgegeben!
Das Anzeigen von zu exportierenden Daten wird durch die beiden Befehle display-patients
und display-samples
ermöglicht, ohne in eine Datei speichern zu müssen.
Die Parameter --filename
, --apend
und --csv
werden dabei ignoriert.
Mit der Tabulator-Taste gelangt man zum nächsten Element. Ist die Tabelle ausgewählt, kann mit den Pfeiltasten der anzuzeigende Ausschnitt ausgewählt werden.