Ein Referenzdatensatz für maschinelles Lernen in der Ökotoxikologie
Oktober 2023
Eawag, Swiss Federal Institute of Aquatic Science and Technology, Dübendorf, Schweiz
Der Einsatz des maschinellen Lernens für die Vorhersage ökotoxikologischer Ergebnisse ist vielversprechend, wird aber noch nicht ausreichend genutzt. Die Aufbereitung von Daten mit aussagekräftigen Merkmalen erfordert sowohl Fachkenntnisse im Bereich des maschinellen Lernens als auch ein fundiertes biologisches und ökotoxikologisches Hintergrundwissen, was eine Einstiegshürde für diese Art von Forschung darstellen kann. Darüber hinaus kann die Leistung der Modelle nur dann mit anderen Studien verglichen werden, wenn dieselben Datensätze, Bereinigungen und Aufteilungen verwendet wurden. Daher stellen die Forscher in dieser Studie ADORE zur Verfügung, einen umfangreichen und gut beschriebenen Datensatz zur akuten aquatischen Toxizität in drei relevanten taxonomischen Gruppen (Fische, Krebstiere und Algen). Der Kerndatensatz beschreibt ökotoxikologische Experimente und wird durch phylogenetische und artspezifische Daten zu den Arten sowie durch chemische Eigenschaften und molekulare Darstellungen ergänzt. Die Forscher heben konkrete Herausforderungen hervor, einschließlich der Extrapolation über taxonomische Gruppen hinweg, um mehr über das Potenzial und die Grenzen des maschinellen Lernens in der Ökotoxikologie zu erfahren.
A benchmark dataset for machine learning in ecotoxicology
Christoph Schür
Eingestellt am: 26.01.2024
[1] https://www.nature.com/articles/s41597-023-02612-2