This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
software:ws20130206 [2013/01/22 07:52] jklump |
software:ws20130206 [2013/02/08 15:49] (current) jklump [Materialien] Link to Strategies in Software Travel added |
||
---|---|---|---|
Line 65: | Line 65: | ||
===== Fragen an die Teilnehmer ===== | ===== Fragen an die Teilnehmer ===== | ||
+ | |||
+ | ==== Zur Person und zum Hintergrund ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > 30% ORCID EU: EU Projekt zu DataCite / ORCID Interoperabilty | ||
+ | > 65% PLOS: Softwareentwickler für einen Open Access Publisher | ||
+ | > 5%: Medizinische Hochschule Hannover: Arzt | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Tomás Zerolo, lange frei schwebender Software-Entwickler (seit ungefähr 1980, ja auch COBOL war dabei :-/ ), grosse Affinität zu freier Software (oder Open Source, wobei ich die " | ||
+ | |||
+ | Kristian Rother: | ||
+ | |||
+ | > Dr. Kristian Rother: Von 1999-2011 Softwareentwickler in der Bioinformatik. Seit 2012 freiberuflicher Trainer fuer effiziente Wissenschaft. Professional Scrum Master. | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > MSc Software System Engineering (HPI/Uni Potsdam). Mehrere Jahre Entwickler bei Siemens. Seit 2008 am GFZ. Softwareentwicklung Tsunami-Frühwarnsysteme, | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Helmholtz Open Access Koordinationsbüro, | ||
+ | |||
+ | ==== Wieso hat sich dieses Thema noch nicht erledigt? ==== | ||
+ | |||
+ | //Wieso hat sich dieses Thema noch nicht erledigt? Warum sollte wissenschaftlicher Code veröffentlicht werden? Wie wird Code Teil der wissenschaftlichen Überlieferung?// | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Momentan kann man als Softwareentwickler in der Wissenschaft eigentlich keine Karriere machen. Auch wenn Software eigentlich ständig gebraucht wird. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Baupläne experimenteller Apparaturen gehören auch zur Veröffentlichung. | ||
+ | |||
+ | Kristian Rother: | ||
+ | |||
+ | > Weil es viel zu einfach ist ein Paper ueber eine Software durchzubringen, | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > Da kann ich mich nur Martin Fenner anschließen: | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Wissenschaftliche Leistung sollte nicht mehr länger alleine an der Anzahl der Paper gemessen werden. Wissenschaftlicher Output sollte umfassender betrachtet werden. Die National Science Foundation (NSF) [[http:// | ||
+ | > Darüber hinaus sollten alle Ergebnisse wissenschaftlicher Arbeit dauerhaft zugänglich gemacht werden. Also auch Software und ihre Dokumentation. Nachnutzung und Nachprüfbarkeit sollen auch nach Ende eines Projektes oder Weggang eines Programmierers möglich sein. | ||
+ | > Ziel sollt es sein Strategien der Software-Publikation zu identifizieren, | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ==== Was sind euer Erfahrungen mit wissenschaftlichem Code, Zugang zu Code, Veröffentlichung, | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Für mich persönlich lief Softwareentwicklung völlig parallel zur Wissenschaft, | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Leider wenig: nach meinem Physikstudium kein Akademiker, nur Sympathisant. | ||
+ | |||
+ | Kristian Rother: | ||
+ | |||
+ | > Code, Veröffentlichung, | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > Software bzw -entwicklung wird nicht allzu sehr anerkannt, sondern ist ein notwendiges übel, was nebenbei abfallen muss. Aber das ist meine persönliche Erfahrung und kann ich anderen Disziplinen ganz anders gelagert sein. | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Die Bedeutung von Software steigt in allen Disziplinen (siehe z.B. die Diskussionen um die Digital Humanities). Damit gewinnt die Professionalisierung der Entwickler an Bedeutung. (In den Biowissenschaften gibt es z.B. Konferenzen und Berufsverbände, | ||
+ | |||
+ | |||
+ | ==== Was sind eure Erwartungen an die Veranstaltung? | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Konkrete Ideen, was als nächstes zu tun ist. Am liebsten auch jenseits von Geosciences. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Das Potenzial der Open Source/Free Software so weit wie möglich in der akademischen Welt realisiert zu sehen. ((Der grosse Reiz der freien Software liegt für mich primär nicht darin, dass sie " | ||
+ | |||
+ | Kristian Rother: | ||
+ | |||
+ | > Lebendiger Austausch mit anderen Entwicklern. | ||
+ | |||
+ | Heinz Pampel | ||
+ | |||
+ | > Ideensammlung. Multidisziplinärer Diskurs. Blick in die Zukunft. | ||
+ | ==== Was sind eure Wünsche oder Ziele im Umgang mit wissenschaftlichem Code? ==== | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Code ist einerseits ein Mittel den Computer dazu zu bringen, einen Teil des Jobs zu erledigen. Auf der anderen Seite soll er meinen Gegenüber davon überzeugen, | ||
+ | |||
+ | Kristian Rother: | ||
+ | |||
+ | > Meine Kernthemen fuer Workshops zum Thema " | ||
+ | |||
+ | ==== Wie persistent sind GitHub, Sourceforge, | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Für einen Zeitraum von 1-5 Jahren (Github wurde Februar 2008 gestartet). Ich erwarte nicht, meine Github-Daten in 20 Jahren noch zu finden. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Meines Erachtens wird zu viel Wert auf das Produkt (GitHub) und nicht so viel auf das Prinzip (Git) gelegt. Der Reiz der verteilten Verionskontrollsysteme liegt ja daran, dass ein Repository nur als Austauschplattform fungiert und durch jedes andere ohne Verluste ersetzt werden kann (sofern die alle synchron gehalten werden). Die Hashes sind invariant! | ||
+ | > Dennoch: Github ist (wenn auch proprietär) gut gemacht und nützlich. | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > Der hohe Bekanntheitsgrad ermöglicht schnelleres Auffinden von thematisch ähnlich gelagerten Projekten. Doch gerade bei Verwendung von verteilter Versionskontrolle (z.B. git) spricht nichts dagegen den Code auf Github sowie auf anderen/ | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Funktionalität steht im Vordergrund (usability). Eine dauerhafte Speicherung wird nicht garantiert. Grundsätzlich stellt sich die Frage ob privat-wirtschaftliche Akteure die optimalen Player für persistente Lösungen sind. | ||
+ | ==== Wie könnte ein Qualitäts-Check jenseits des klassischen Peer-Review aussehen? ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Die Software muß laufen, z.B. mit einem Beispiel-Datensatz. Oder "5 Stars of Scientific Software": | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Unit tests. Natürlich muss Anfwand abgewogen werden. | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Das Verfahren der Qualitätssicherung schient abhängig von der Publikationsstrategie zu sein. Wir ein Paper veröffentlicht, | ||
+ | ==== Welche Erfahrungen habt ihr mit der Wahl von Lizenzen und mit Lizenzkonflikten? | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Proprietäre Bibliotheken vermeide ich, ebenso Bibliotheken, | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Da empfehle ich einen Blick auf grosse Distributionen. Eine wie Debian nimmt die Lizenzverwaltung sehr ernst und hat da gute Pionierarbeit geleistet. | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > Bei komplexen Systemen basierend auf diversen Fremdbilbiotheken mit unterschiedlichsten Lizenzen wird es schnell unübersichtlich. Wir verwenden LGPL bzw GPL. | ||
+ | |||
+ | ==== Wie verhält sich FOSS zu proprietären Bibliotheken (MS, MATLAB, Apps, ...)? ==== | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Gemischt. Grundsätzlich sind alle relevanten FOSS-Lizenzen so, dass sie den Endnutzer/ | ||
+ | > Natürlich neige ich dazu zu sagen, freie Software passe besser zum Wissenschaftsbetrieb (bessere Kontrolle darüber, was " | ||
+ | |||
+ | |||
+ | ==== Wie können komplexe Softwarestacks veröffentlicht werden? ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Als virtuelle Images, z.B. http:// | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Das dürfte eine der schwierigeren und interessanteren Themen sein. Wieder turnen uns da die Distributionen vor, was es für Möglichkeiten und Konflikte gibt. | ||
+ | |||
+ | Matthias Lendholt: | ||
+ | |||
+ | > Sobald Fremdbibliotheken, | ||
+ | > Build-Strategien, | ||
+ | |||
+ | ==== Wie verhalten sich Versionierung und Identifier zueinander? DOI für nightly builds? ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > DOIs für Major releases, Handles für nightly builds. DataCite hat eine ähnliche Philosophie für Daten. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Nightly builds sind ja nur eine spezielle Strategie, die nicht immer so umgesetzt wird. Was aber feststeht sind Releases (vgl. die Antwort von Martin Fenner, der ich nur zustimmen kann). Ein (major oder minor) release signalisiert: | ||
+ | |||
+ | ==== Wie soll mit Schadsoftware umgegangen werden? ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Jedes Code Repository sollte Regeln haben, welche Software es hostet. Es geht nicht nur um Schadsoftware, | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Schwieriges Thema. Bei Software "aus der Quelle" | ||
+ | |||
+ | ==== Soll es unter Umständen Embargo-Fristen geben, in denen Code noch nicht zugänglich ist, um z.B. einem Doktoranden noch Zeit zu geben, die Doktorarbeit abzuschließen? | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Nein, ähnlich wie bei Open Access. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Man darf nicht aus den Augen verlieren, dass die wissenschaftliche Arbeit Priorität hat: Software verteilfähig zu machen ist mit nicht geringem Aufwand verbunden. Andererseits kann die Korrektheit der Software durch Öffentlichkeit profitieren. Um ständige Abwägung kommt man, fürchte ich, nicht herum. | ||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Ein Paper, dass Software beschreibt, scheint nur dann sinnig, wenn der Code zum Zeitpunkt der Veröffentlichung zugänglich ist. Anderfalls müsste auch überlegt werden, wie die Software begutachtet werden kann. | ||
+ | ==== Wie soll die langfristige Strategie eines Code Repository sein (t > 5 Jahre) ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Eine langfristige Strategie ist nötig. Nicht jedes Commit und jede Software muß aufgehoben werden, Major Releases und Software, die für Datenpublikation verwendet wurde, reicht wahrscheinlich. Ein anderes Problem ist die Infrastruktur / Platform. Der Code nutzt wenig, wenn es das Betriebssystem und benötigte Softwarebibliotheken nicht mehr in der richtigen Version gibt. Wahrscheinlich benötigen wir eine spezielle Infrastruktur und diese Aufgaben werden nicht von traditionellen Code Repositories übernommen. Alles, was eine DOI hat, braucht Langzeitarchivierung, | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Wie gesagt: mit modernen VCSen ist die " | ||
+ | > Ob ich diesen Code auch zum Laufen bringe? Libraries? Plattform? Hardware? Das ist der interessantere Teil. | ||
+ | |||
+ | |||
+ | ==== Wie passen Beiträge zu FOSS und die Veröffentlichung von Code zu den Metriken der Bibliometrie und des Wissenschafts-Controlling? | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Traditionelle Zitate funktionieren wahrscheinlich nicht. Wir brauchen Nutzungsstatistiken und altmetrics. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Wenn ich hier etwas von mir gebe lehne ich mich zu sehr aus dem Fenster. Ich versuche es trotzdem: ja, auch Veröffentlichung von Code ist Veröffentlichung: | ||
+ | |||
+ | ==== Welche Rolle spielen Workflows? Sind sie auch Code? ==== | ||
+ | |||
+ | Martin Fenner: | ||
+ | |||
+ | > Die Abgrenzung Software / Data / Text ist manchmal sehr schwierig. | ||
+ | |||
+ | Tomás Zerolo: | ||
+ | |||
+ | > Ja. Ob digitale Hardware oder Arbeitsteams " | ||
+ | |||
+ | |||
+ | Heinz Pampel: | ||
+ | |||
+ | > Mit Blick auf die Nachnutzung ist jegliche Dokumention wertvoll und sinvoll. Längerfristig müssen die einzelnen Disziplinen Stratgien entwickeln. | ||
+ | |||
===== Materialien ===== | ===== Materialien ===== | ||
+ | |||
+ | [[software: | ||
+ | |||
+ | [[software: | ||
+ | |||
+ | |||
+ | [[software: | ||