Analysis of IT Security aspects in Open Source Software Development
Betreuer/inProf. Dr. Oliver Hinz
ProfessorProf. Dr. Oliver Hinz
Starttermin ab sofort
EmpirischJa
KurzbeschreibungScope of the thesis depends on type of work (Bachelor- or Masterthesis) The goal of this thesis is to find out more about the economic impact of IT Security issues on developed open source software. As a first step a SourceForge database analysis should deliver necessary data to get a deeper knowledge into the relation of IT Security issues during software development and their impact on the developed product and its maintenance. Exemplary variables to retrieve are security bugs, security feature requests, etc. Also a comparison of developed software and vulnerability databases could provide valuable insights. In this thesis security relevant information should be retrieved from the SourceForge database and their impact on the development process and the deployment should be analyzed. Questions to analyze include: Are relations detectable between security issues and product usage, upgrades and extension mechanisms? Are security relevant trends detectable in development processes? Are there significant differences traceable between different kinds of software? Etc.

Tasks:
Thorough research on open source development and IT Security
Analyze the SourceForge database
Implement a mechanism to retrieve relevant data
Scientifically justify your procedure
Analyze the data and draw conclusions


Requirements:
High motivation and creativity
Good knowledge of and interest in IT Security
Good programing skills
Good experience with reading research papers
EinstiegsliteraturKevin Crowston, Kangning Wei, James Howison, and Andrea Wiggins. 2008. Free/Libre open-source software development: What we know and what we do not know. ACM Comput. Surv. 44, 2, Article 7 (March 2008).
Flore Barcellini, Françoise Détienne, Jean-Marie Burkhardt, and Warren Sack. 2008. A socio-cognitive analysis of online design discussions in an Open Source Software community. Interact. Comput. 20, 1 (January 2008), 141-165.
Eric von Hippel and Georg von Krogh. 2003. Open Source Software and the "Private-Collective" Innovation Model: Issues for Organization Science. Organization Science 14, 2 (March 2003), 209-223.
Walt Scacchi, Thomas A. Alspaugh. Processes in Securing Open Architecture Software Systems, Proc. 2013 Intern. Conf. Software and System Processes, May 2013, San Francisco, CA.

Offene Themen

Generative KI in kreativen Kontexten

Kurzbeschreibung: 

Generative KI, ein sich entwickelnder Bereich innerhalb der künstlichen Intelligenz (KI), konzentriert sich auf die Entwicklung von Systemen, die in der Lage sind, selbstständig Inhalte zu erstellen, seien es Texte, Bilder oder andere Formen von Daten. Sie basiert auf fortschrittlichen Algorithmen, die oft tiefe neuronale Netze umfassen und es Maschinen ermöglichen, auf der Grundlage von Mustern, die sie aus vorhandenen Daten gelernt haben, neuartige Ergebnisse zu erzeugen. Diese Technologie hat sich in verschiedenen Anwendungen als vielversprechend erwiesen, von der Verarbeitung natürlicher Sprache bis hin zu kreativen Unternehmungen wie der Erzeugung von Bildern und Musik. Ein Verständnis der Fähigkeiten und Herausforderungen der generativen KI ist von entscheidender Bedeutung, da sie zu einem integralen Bestandteil unserer täglichen Umgebung wird.

Zielsetzung:

In der ersten Sitzung werden gemeinsam spezifische Forschungsfragen diskutiert. Ziel ist es, einen systematischen Literaturüberblick zu erstellen.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Rebecca Heigl (rmheigl(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Algorithmic Management im Kontext von Influencern: Eine qualitative Masterarbeit mit Grounded Theory-Ansatz

Kurzbeschreibung: 

Social-Media-Plattformen sind im täglichen Leben allgegenwärtig. Sie sind äußerst mächtige Akteure, die das Verhalten von Milliarden von Menschen beeinflussen. Im digitalen Zeitalter üben Influencer eine erhebliche Macht bei der Gestaltung von Online-Narrativen und dem Verbraucherverhalten aus. Um einen tieferen Einblick in ihre dynamische Welt zu erhalten, versucht diese Studie herauszufinden, wie Influencer den Einfluss von algorithmusgesteuerten Content-Strategien auf ihre kreativen Prozesse wahrnehmen und wie sie das Bedürfnis nach Sichtbarkeit mit der Notwendigkeit, ihre persönliche Privatsphäre zu schützen, geschickt abwägen. Als empirische Methode werden qualitative Interviews mit Influencern geführt, die danach mit Hilfe von Grounded Theory ausgewertet werden sollen.

Zielsetzung:

Wie nehmen Influencer die Rolle von algorithmusgesteuerten Inhalten bei der Gestaltung ihrer Strategien zur Inhaltserstellung wahr?

Wie gehen Influencer mit dem Spannungsverhältnis zwischen ihrer Abhängigkeit von Algorithmen in Bezug auf Sichtbarkeit und dem Wunsch nach Schutz ihrer persönlichen Privatsphäre um?

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen Lebenslauf an Rebecca Heigl (rmheigl(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Vorhersage und Erklärung von Lebensumständen in Entwicklungs- und Schwellenländern

Kurzbeschreibung: 

Zahlreiche Faktoren können die Lebensumstände von Menschen, wie das Armutsrisiko oder die Gesundheit, beeinflussen. Vor allem im Bezug auf Entwicklungs- und Schwellenländer ist es wichtig, diese Faktoren zu identifizieren und Interventionsmaßnahmen abzuleiten. Ökonomen vertrauen bei der Untersuchung solcher Einflussfaktoren in der Regel auf parametrische statistische Methoden wie der Regressionsanalyse. Mit dem Aufkommen der Erklärbaren Künstlichen Intelligenz (XAI) können jedoch auch nicht-parametrische Modelle verwendet werden, um komplexere, nicht lineare Zusammenhänge in Daten zu analysieren.

Ziele dieser Masterarbeit sind: Erstens, die Entwicklung performanter Machine Learning Modelle zur Vorhersage verschiedener Lebensumstände von Kindern aus Entwicklungs- und Schwellenländern. Zweitens, die Anwendung von XAI Methoden zur Erkenntnisgewinnung der wichtigsten Einflussfaktoren für jene Lebensumstände. Für die Analysen werden umfangreiche Panel-Daten zur Verfügung gestellt.

Voraussetzungen: 

Hohe Kompetenzen im Data Science Prozess und in Python oder ähnlichen Programmiersprachen notwendig.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel, einen Lebenslauf und eine kurze Übersicht vergangener Data Science-bezogener Projekte an Jan Zacharias (zacharias(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

 

 

Vorhersage von Song-Hits mittels Audio-Features und Marktdaten

Kurzbeschreibung: 

Plattenfirmen investieren enorme Summen und Ressourcen in neue Talente oder etablierte Künstler, bevor ein Song tatsächlich veröffentlicht wird. Ein Einblick in das, was einen Hit ausmacht, und die Vorhersage des Erfolgs eines Songs würden der Musikindustrie enorme Vorteile bringen. Wissenschaftliche Belege für die Vorhersage von Hits sind jedoch rar. In der Literatur wird diese Frage aus zwei Blickwinkeln angegangen: aus einer internen Perspektive, die sich ausschließlich auf (musikalische) Merkmale stützt, die aus dem Audiomaterial extrahiert werden, und aus einer externen Perspektive, die Aspekte des musikalischen Ökosystems modelliert, indem beispielsweise soziale Medien oder Marktdaten einbezogen werden. Zu den musikalischen Merkmalen gehören Low-Level-Merkmale, die akustische Deskriptoren wie Lautstärke, Dynamik und spektrale Form eines Signals, Rhythmusdeskriptoren oder tonale Informationen erfassen. Im Gegensatz dazu erfassen High-Level-Features abstrakte Konzepte wie Stimmung, Genres, Gesang oder Musikart. Ziel dieser Arbeit ist es, die bisherigen Erkenntnisse in der Literatur zu erweitern, indem sowohl die interne als auch die externe Perspektive in die Analyse einbezogen wird. Die Daten können aus öffentlichen Datenbanken wie dem frei zugänglichen Million Song Dataset (MSD) entnommen werden, das eine Million Songs enthält, die repräsentativ für westliche kommerzielle Musik sind. Für die Extraktion von Low- und High-Level-Features aus den Audiodaten kann das Essentia-Framework verwendet werden. Daten aus sozialen Medien (z. B. Facebook, Instagram) und Marktdaten (z. B. Spotify) liefern ebenfalls wertvolle Erkenntnisse für diese Forschung. Um die Frage zu beantworten, ob Hits vorhergesagt werden können, sollten verschiedene Algorithmen des maschinellen Lernens verwendet werden, wie z.B. Logistische Regression, Entscheidungsbäume, Naïve Bayes und Random Forests. Erforderlich sind sehr gute Programmierkenntnisse und Know-How im Bereich des maschinellen Lernens, insbesondere in Python.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen kurzen Lebenslauf an Prof. Oliver Hinz (hinz(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

Einstiegsliteratur:

  • Dorien Herremans, David Martens, and Kenneth Sörensen. Dance hit song prediction. Journal of New Music Research, 43(3):291–302, 2014.
  • Myra Interiano, Kamyar Kazemi, Lijia Wang, Jienian Yang, Zhaoxia Yu, and Natalia L. Komarova. Musical trends and predictability of success in contemporary songs in and out of the top charts. Royal Society Open Science, 5(5), 2018.
  • H. Silk, R. Santos-Rodriguez, C. Mesnage, T. De Bie, and M. McVicar, “Data science for the detection of emerging music styles,” EPSRC, pp. 4–6, 2014.
  • Yekyung Kim, Bongwon Suh, and Kyogu Lee. #nowplaying the future billboard: Mining music listening behaviors of twitter users for hit song prediction. In Proc. International Workshop on Social Media Retrieval and Analysis, pages 51–56. ACM, 2014
  • Xiao Hu and J Stephen Downie. Exploring mood metadata: Relationships with genre, artist and usage metadata. In Proc. International Society for Music Information Retrieval Conference, pages 67–72, 2007.

 

 

Vergleichende Untersuchung des Product Carbon Footprints von eBooks und gedruckten Büchern

Kurzbeschreibung: 

Fach- und Unterhaltungsliteratur wird zunehmend digital, als sog. eBooks, zur Verfügung gestellt und gelesen. Dabei entfallen ggü. der gedruckten Form einerseits Kosten und Umweltbelastungen bei Herstellung (inkl. der benötigten Vorprodukte wie bspw. Papier, Druckfarben), Verpackung, Lagerung und Transport sowie bei der Entsorgung von Mängel- und Restexemplaren und ggf. sogar beim Lesen (in Form elektrischen Lichts). Andererseits entstehen neue Kosten und Umweltbelastungen durch Datenspeicherung, -verarbeitung und -transport sowie durch Herstellung, Betrieb und Entsorgung der zum Lesen genutzten Hardware (bspw. dezidierte eBook-Reader, oder Tablets, Notebooks, Smartphones und Desktop-Computer, die auch anderen Einsatzzwecken dienen). Ein Vergleich der Umweltbelastungen beider Medienformate entlang der gesamten Wertschöpfungs- und Lebensdauer (Cradle-to-Grave) ist aufgrund der multidimensionalen Einflussparameter (bspw. Anzahl und Umfang der gelesenen Bücher über einen definierten Zeitraum, Konsum neuer/gebrauchter/geliehener Bücher, Kauf bzw. Ausleihe stationär/online, Lesen bei Tageslicht/Dunkelheit, Energiemix, Art und Nutzungsdauer der eingesetzten Hardware, etc.) sehr komplex.

Das Ziel dieser Masterarbeit soll sein, einen Vergleich der Umweltbelastungen – insbesondere des Product Carbon Footprint, bei dem die Treibhausgasemissionen als CO2-Äquivalent für die komplette Lebensdauer eines Produktes ermittelt werden – beider Medienformate (Print vs. eBook) in einer quantifizierbaren Form und in Abhängigkeit von den relevanten Parametern hinsichtlich Herstellung, Kauf- und Leseverhalten, Energiemix, Hardware und ggf. anderen zu ermitteln. Für die identifizierten Parameter sollen statistisch belegbare „typische“ Werte bzw. -bereiche ermittelt werden und die jeweiligen Umweltbelastungen für entsprechende Szenarien konkret berechnet und verglichen werden.

Die Arbeit erfolgt im Auftrag der Bookwire GmbH, einem führenden, international tätigen Anbieter von digitalen Dienstleistungen für Verlage und Self-Publishing-Autoren. Bei beiderseitigem Interesse besteht nach erfolgreichem Studienabschluss die Möglichkeit, gemeinsam mit dem hochmotivierten und -qualifizierten Team der Bookwire die Zukunft des Publizierens zu gestalten.

Bei Interesse an der Abschlussarbeit schicken Sie bitte einen aktuellen Leistungsspiegel und einen kurzen Lebenslauf an Prof. Oliver Hinz (hinz(at)wiwi.uni-frankfurt.de).

Ausgeschrieben ab: sofort

Einstiegsliteratur:

  • A. Manhart. E. Brommer, J. Gröger: PROSA E-Book-Reader - Entwicklung der Vergabekriterien für ein klimaschutzbezogenes Umweltzeichen, Öko-Institut e.V., Freiburg, Juni 2011
  • Moberg, A.; Borggren, C.; Finnveden, G.: Books from an environmental perspective – Part 2: e-books as an alternative to paper books”. International Journal of Life Cycle Assessment (2011) 16:238- 246, Stockholm 2011
  • Q. Kang, J. Lu, J. Xu: Is e-reading environmentally more sustainable than conventional reading? Evidence from a systematic literature review, Library & Information Science Research Volume 43, Issue 3, July 2021, 101105
  • V. Court, S. Sorrell: Digitalisation of goods: a systematic review of the determinants and magnitude of the impacts on energy consumption, 2020, Environmental Research Letters 15 043001
  • Amasawa, E., Ihara, T. & Hanaki, K. Role of e-reader adoption in life cycle greenhouse gas emissions of book reading activities. Int J Life Cycle Assess 23, 1874–1887 (2018).
  • U. Wilke: »Grüner« lesen: Buch oder eBook? - Konzeption eines Bewertungssystems für nachhaltiges Leseverhalten Masterarbeit (Nov. 2013) an Hochschule für Technik, Wirtschaft und Kultur in Leipzig, Fakultät Medien, Studiengang Medienmanagement.
  • Jeswani, H.K., Azapagic, A. Is e-reading environmentally more sustainable than conventional reading?. Clean Techn Environ Policy 17, 803–809 (2015).
  • J.F. Aigner: Environmental Implications of Media Consumption embedded in Digital Ecosystems - A bottom-up systems approach to the perennial case of paperless reading in Germany, Degree Project in Environmental Engineering, KTH Royal Institute of Technology, School of Architecture and the built Environment Stockholm, Sweden, 2018.

 

 

Top