Analysis of IT Security aspects in Open Source Software Development
Betreuer/inProf. Dr. Oliver Hinz
ProfessorProf. Dr. Oliver Hinz
Starttermin ab sofort
EmpirischJa
KurzbeschreibungScope of the thesis depends on type of work (Bachelor- or Masterthesis) The goal of this thesis is to find out more about the economic impact of IT Security issues on developed open source software. As a first step a SourceForge database analysis should deliver necessary data to get a deeper knowledge into the relation of IT Security issues during software development and their impact on the developed product and its maintenance. Exemplary variables to retrieve are security bugs, security feature requests, etc. Also a comparison of developed software and vulnerability databases could provide valuable insights. In this thesis security relevant information should be retrieved from the SourceForge database and their impact on the development process and the deployment should be analyzed. Questions to analyze include: Are relations detectable between security issues and product usage, upgrades and extension mechanisms? Are security relevant trends detectable in development processes? Are there significant differences traceable between different kinds of software? Etc.

Tasks:
Thorough research on open source development and IT Security
Analyze the SourceForge database
Implement a mechanism to retrieve relevant data
Scientifically justify your procedure
Analyze the data and draw conclusions


Requirements:
High motivation and creativity
Good knowledge of and interest in IT Security
Good programing skills
Good experience with reading research papers
EinstiegsliteraturKevin Crowston, Kangning Wei, James Howison, and Andrea Wiggins. 2008. Free/Libre open-source software development: What we know and what we do not know. ACM Comput. Surv. 44, 2, Article 7 (March 2008).
Flore Barcellini, Françoise Détienne, Jean-Marie Burkhardt, and Warren Sack. 2008. A socio-cognitive analysis of online design discussions in an Open Source Software community. Interact. Comput. 20, 1 (January 2008), 141-165.
Eric von Hippel and Georg von Krogh. 2003. Open Source Software and the "Private-Collective" Innovation Model: Issues for Organization Science. Organization Science 14, 2 (March 2003), 209-223.
Walt Scacchi, Thomas A. Alspaugh. Processes in Securing Open Architecture Software Systems, Proc. 2013 Intern. Conf. Software and System Processes, May 2013, San Francisco, CA.

Offene Themen

Effekte von Corporate Digital Responsibility-Engagement

Kurzbeschreibung: 

Corporate Digital Responsibility (CDR) beschreibt die freiwillige Übernahme von Unternehmensverantwortung im digitalen Kontext. Das Konzept gewinnt in den letzten Jahren zunehmend an Aufmerksamkeit in Forschung und Praxis. Während das grundsätzliche Verständnis konvergiert, ist die empirische Evaluierung von CDR noch im Anfangsstadium. Dazu soll ein Beitrag geleistet werden und mögliche (positive) Effekte von CDR-Engagement auf Unternehmen gemessen werden. Ziel der Arbeit ist zu beantworten, ob sich CDR-Engagement abseits der intrinsischen Motivation für Unternehmen auszahlen kann.

Zielsetzung:

In der ersten Sitzung werden gemeinsam spezifische Forschungsfragen diskutiert und das weitere Vorgehen festgelegt. Mithilfe einer Case Study in Zusammenarbeit mit einem Unternehmen sollen die Effekte von CDR-Engagement in der Praxis gemessen werden und so experimentell erworbene Erkenntnisse ergänzen.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Dr. K. Valerie Carl (kcarl@wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

Cyber Threat Intelligence

Kurzbeschreibung: 

Unter Cyber Threat Intelligence (CTI) versteht man das systematische Sammeln und Auswerten von Daten, die zur Einschätzung der Sicherheitslage von Unternehmen relevant sind. Diese Daten können dabei sehr unterschiedlich sein und sich z.B. auf fehlerhafte Benutzerlogins im Intranet, geleakte Passwörter im Darknet, Hackerforenbeiträge, verdächtige IP-Adressen, offene Ports oder frei Verfügbare Information des Unternehmens beziehen. Dabei wird versucht zu verstehen wie Hacker im Falle eines Angriffes vorgehen könnten, um möglichst proaktiv anstatt reaktiv handeln zu können. Im Rahmen einer wissenschaftlichen Arbeit könnte man CTI-relevante Daten(quellen) untersuchen, um eine Einschätzung geben zu können in wie weit diese für eine situative Analyse der Bedrohungslage von Unternehmen geeignet sind. Ziel ist es zu verstehen welche Daten(quellen) zur Risikoidentifikation dienen können.
In der ersten Sitzung werden gemeinsam spezifische Forschungsfragen diskutiert und das weitere Vorgehen festgelegt. Das Thema ist bewusst generisch gehalten und bietet folgende Möglichkeiten:

  • Eine Literaturrecherche zum Thema CTI und/oder das Durchführen und Auswerten von Interviews/Surveys
  • Erstellen einer Taxonomie zur wissenschaftlichen Kategorisierung von CTI-relevanten Datensätzen
  • Die empirische Auswertung von CTI Daten (z.B: Hackerforenbeiträge und veröffentliche Meldungen zu Schwachstellen auswerten). Zum Teil können Datensätze bereitgestellt werden.
  • … eigene Ideen

Voraussetzungen:

Interesse am Thema Cyber Security. Für die empirische Auswertungen werden gute Programmierkenntnisse vorausgesetzt.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Frederik Hering (hering(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

(Food-)Hygienecasting: Vorhersage von Hygienemängeln in Restaurants

Kurzbeschreibung: 

In Deutschland und zum Teil auch anderen Ländern müssen die Gesundheitsämter darüber informieren, wenn Restaurants und Gaststätten aufgrund von hygienischen Mängeln (z.B. Schädlingsbefall) geschlossen werden. Diese Informationen könnten im Rahmen einer wissenschaftlichen Arbeit mit Onlinebewertungen von Google Maps verglichen werden. Dabei könnte man versuchen Hygienemängel mit Hilfe von Textanalysen (Natural Language Processing) und/oder der Analyse von hochgeladen Bildern vorherzusagen. Des Weiteren könnte man analysieren ob/wie sich Restaurantbewertungen durch einen aufgetretenen Hygienemangel langfristig ändern. Ziel der Arbeit ist die Entwicklung eines Machine Learning Modells zur Vorhersage von Hygienemängel und der empirischen Analyse von Google Maps Bewertungen.

Voraussetzungen:

Gute Programmierkenntnisse in Python oder R. Interesse an Data Science/Datenanalyse und dem Crawlen von Daten. Ein ausreichend großer Datensatz von Google Maps Bewertungen wird zur Verfügung gestellt. Allerdings müsste ein Datensatz mit Hygienemängel der Restaurants erstellt und mit den Google Maps Datensatz verbunden werden. Für die Hygienemängel würde es sich anbieten die Websiten der Verbraucherzentralen automatisiert zu crawlen (z.B. verbraucherfenster.hessen.de).

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Frederik Hering (hering(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Generative KI in kreativen Kontexten

Kurzbeschreibung: 

Generative KI, ein sich entwickelnder Bereich innerhalb der künstlichen Intelligenz (KI), konzentriert sich auf die Entwicklung von Systemen, die in der Lage sind, selbstständig Inhalte zu erstellen, seien es Texte, Bilder oder andere Formen von Daten. Sie basiert auf fortschrittlichen Algorithmen, die oft tiefe neuronale Netze umfassen und es Maschinen ermöglichen, auf der Grundlage von Mustern, die sie aus vorhandenen Daten gelernt haben, neuartige Ergebnisse zu erzeugen. Diese Technologie hat sich in verschiedenen Anwendungen als vielversprechend erwiesen, von der Verarbeitung natürlicher Sprache bis hin zu kreativen Unternehmungen wie der Erzeugung von Bildern und Musik. Ein Verständnis der Fähigkeiten und Herausforderungen der generativen KI ist von entscheidender Bedeutung, da sie zu einem integralen Bestandteil unserer täglichen Umgebung wird.

Zielsetzung:

In der ersten Sitzung werden gemeinsam spezifische Forschungsfragen diskutiert. Ziel ist es, einen systematischen Literaturüberblick zu erstellen.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Rebecca Heigl (rmheigl(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Algorithmic Management im Kontext von Influencern: Eine qualitative Masterarbeit mit Grounded Theory-Ansatz

Kurzbeschreibung: 

Social-Media-Plattformen sind im täglichen Leben allgegenwärtig. Sie sind äußerst mächtige Akteure, die das Verhalten von Milliarden von Menschen beeinflussen. Im digitalen Zeitalter üben Influencer eine erhebliche Macht bei der Gestaltung von Online-Narrativen und dem Verbraucherverhalten aus. Um einen tieferen Einblick in ihre dynamische Welt zu erhalten, versucht diese Studie herauszufinden, wie Influencer den Einfluss von algorithmusgesteuerten Content-Strategien auf ihre kreativen Prozesse wahrnehmen und wie sie das Bedürfnis nach Sichtbarkeit mit der Notwendigkeit, ihre persönliche Privatsphäre zu schützen, geschickt abwägen. Als empirische Methode werden qualitative Interviews mit Influencern geführt, die danach mit Hilfe von Grounded Theory ausgewertet werden sollen.

Zielsetzung:

Wie nehmen Influencer die Rolle von algorithmusgesteuerten Inhalten bei der Gestaltung ihrer Strategien zur Inhaltserstellung wahr?

Wie gehen Influencer mit dem Spannungsverhältnis zwischen ihrer Abhängigkeit von Algorithmen in Bezug auf Sichtbarkeit und dem Wunsch nach Schutz ihrer persönlichen Privatsphäre um?

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Rebecca Heigl (rmheigl(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Vorhersage von Song-Hits mittels Audio-Features und Marktdaten

Kurzbeschreibung: 

Plattenfirmen investieren enorme Summen und Ressourcen in neue Talente oder etablierte Künstler, bevor ein Song tatsächlich veröffentlicht wird. Ein Einblick in das, was einen Hit ausmacht, und die Vorhersage des Erfolgs eines Songs würden der Musikindustrie enorme Vorteile bringen. Wissenschaftliche Belege für die Vorhersage von Hits sind jedoch rar. In der Literatur wird diese Frage aus zwei Blickwinkeln angegangen: aus einer internen Perspektive, die sich ausschließlich auf (musikalische) Merkmale stützt, die aus dem Audiomaterial extrahiert werden, und aus einer externen Perspektive, die Aspekte des musikalischen Ökosystems modelliert, indem beispielsweise soziale Medien oder Marktdaten einbezogen werden. Zu den musikalischen Merkmalen gehören Low-Level-Merkmale, die akustische Deskriptoren wie Lautstärke, Dynamik und spektrale Form eines Signals, Rhythmusdeskriptoren oder tonale Informationen erfassen. Im Gegensatz dazu erfassen High-Level-Features abstrakte Konzepte wie Stimmung, Genres, Gesang oder Musikart. Ziel dieser Arbeit ist es, die bisherigen Erkenntnisse in der Literatur zu erweitern, indem sowohl die interne als auch die externe Perspektive in die Analyse einbezogen wird. Die Daten können aus öffentlichen Datenbanken wie dem frei zugänglichen Million Song Dataset (MSD) entnommen werden, das eine Million Songs enthält, die repräsentativ für westliche kommerzielle Musik sind. Für die Extraktion von Low- und High-Level-Features aus den Audiodaten kann das Essentia-Framework verwendet werden. Daten aus sozialen Medien (z. B. Facebook, Instagram) und Marktdaten (z. B. Spotify) liefern ebenfalls wertvolle Erkenntnisse für diese Forschung. Um die Frage zu beantworten, ob Hits vorhergesagt werden können, sollten verschiedene Algorithmen des maschinellen Lernens verwendet werden, wie z.B. Logistische Regression, Entscheidungsbäume, Naïve Bayes und Random Forests. Erforderlich sind sehr gute Programmierkenntnisse und Know-How im Bereich des maschinellen Lernens, insbesondere in Python.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen kurzen Lebenslauf an Prof. Oliver Hinz (hinz(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

Einstiegsliteratur:

  • Dorien Herremans, David Martens, and Kenneth Sörensen. Dance hit song prediction. Journal of New Music Research, 43(3):291–302, 2014.
  • Myra Interiano, Kamyar Kazemi, Lijia Wang, Jienian Yang, Zhaoxia Yu, and Natalia L. Komarova. Musical trends and predictability of success in contemporary songs in and out of the top charts. Royal Society Open Science, 5(5), 2018.
  • H. Silk, R. Santos-Rodriguez, C. Mesnage, T. De Bie, and M. McVicar, “Data science for the detection of emerging music styles,” EPSRC, pp. 4–6, 2014.
  • Yekyung Kim, Bongwon Suh, and Kyogu Lee. #nowplaying the future billboard: Mining music listening behaviors of twitter users for hit song prediction. In Proc. International Workshop on Social Media Retrieval and Analysis, pages 51–56. ACM, 2014
  • Xiao Hu and J Stephen Downie. Exploring mood metadata: Relationships with genre, artist and usage metadata. In Proc. International Society for Music Information Retrieval Conference, pages 67–72, 2007.

 

 

Vergleichende Untersuchung des Product Carbon Footprints von eBooks und gedruckten Büchern

Kurzbeschreibung: 

Fach- und Unterhaltungsliteratur wird zunehmend digital, als sog. eBooks, zur Verfügung gestellt und gelesen. Dabei entfallen ggü. der gedruckten Form einerseits Kosten und Umweltbelastungen bei Herstellung (inkl. der benötigten Vorprodukte wie bspw. Papier, Druckfarben), Verpackung, Lagerung und Transport sowie bei der Entsorgung von Mängel- und Restexemplaren und ggf. sogar beim Lesen (in Form elektrischen Lichts). Andererseits entstehen neue Kosten und Umweltbelastungen durch Datenspeicherung, -verarbeitung und -transport sowie durch Herstellung, Betrieb und Entsorgung der zum Lesen genutzten Hardware (bspw. dezidierte eBook-Reader, oder Tablets, Notebooks, Smartphones und Desktop-Computer, die auch anderen Einsatzzwecken dienen). Ein Vergleich der Umweltbelastungen beider Medienformate entlang der gesamten Wertschöpfungs- und Lebensdauer (Cradle-to-Grave) ist aufgrund der multidimensionalen Einflussparameter (bspw. Anzahl und Umfang der gelesenen Bücher über einen definierten Zeitraum, Konsum neuer/gebrauchter/geliehener Bücher, Kauf bzw. Ausleihe stationär/online, Lesen bei Tageslicht/Dunkelheit, Energiemix, Art und Nutzungsdauer der eingesetzten Hardware, etc.) sehr komplex.

Das Ziel dieser Masterarbeit soll sein, einen Vergleich der Umweltbelastungen – insbesondere des Product Carbon Footprint, bei dem die Treibhausgasemissionen als CO2-Äquivalent für die komplette Lebensdauer eines Produktes ermittelt werden – beider Medienformate (Print vs. eBook) in einer quantifizierbaren Form und in Abhängigkeit von den relevanten Parametern hinsichtlich Herstellung, Kauf- und Leseverhalten, Energiemix, Hardware und ggf. anderen zu ermitteln. Für die identifizierten Parameter sollen statistisch belegbare „typische“ Werte bzw. -bereiche ermittelt werden und die jeweiligen Umweltbelastungen für entsprechende Szenarien konkret berechnet und verglichen werden.

Die Arbeit erfolgt im Auftrag der Bookwire GmbH, einem führenden, international tätigen Anbieter von digitalen Dienstleistungen für Verlage und Self-Publishing-Autoren. Bei beiderseitigem Interesse besteht nach erfolgreichem Studienabschluss die Möglichkeit, gemeinsam mit dem hochmotivierten und -qualifizierten Team der Bookwire die Zukunft des Publizierens zu gestalten.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen kurzen Lebenslauf an Prof. Oliver Hinz (hinz(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

Einstiegsliteratur:

  • A. Manhart. E. Brommer, J. Gröger: PROSA E-Book-Reader - Entwicklung der Vergabekriterien für ein klimaschutzbezogenes Umweltzeichen, Öko-Institut e.V., Freiburg, Juni 2011
  • Moberg, A.; Borggren, C.; Finnveden, G.: Books from an environmental perspective – Part 2: e-books as an alternative to paper books”. International Journal of Life Cycle Assessment (2011) 16:238- 246, Stockholm 2011
  • Q. Kang, J. Lu, J. Xu: Is e-reading environmentally more sustainable than conventional reading? Evidence from a systematic literature review, Library & Information Science Research Volume 43, Issue 3, July 2021, 101105
  • V. Court, S. Sorrell: Digitalisation of goods: a systematic review of the determinants and magnitude of the impacts on energy consumption, 2020, Environmental Research Letters 15 043001
  • Amasawa, E., Ihara, T. & Hanaki, K. Role of e-reader adoption in life cycle greenhouse gas emissions of book reading activities. Int J Life Cycle Assess 23, 1874–1887 (2018).
  • U. Wilke: »Grüner« lesen: Buch oder eBook? - Konzeption eines Bewertungssystems für nachhaltiges Leseverhalten Masterarbeit (Nov. 2013) an Hochschule für Technik, Wirtschaft und Kultur in Leipzig, Fakultät Medien, Studiengang Medienmanagement.
  • Jeswani, H.K., Azapagic, A. Is e-reading environmentally more sustainable than conventional reading?. Clean Techn Environ Policy 17, 803–809 (2015).
  • J.F. Aigner: Environmental Implications of Media Consumption embedded in Digital Ecosystems - A bottom-up systems approach to the perennial case of paperless reading in Germany, Degree Project in Environmental Engineering, KTH Royal Institute of Technology, School of Architecture and the built Environment Stockholm, Sweden, 2018.

 

 

Top