Welche Aufgaben erwarten dich?
- Du unterstützt die Weiterentwicklung von großen Sprachmodellen (Large Language Models) zu multi-modalen Modellen, die Audio und Vision umfassen, sowie Any-to-Any Modellen wie Vision2Text, Text2Text und Audio2Audio.
- Die Recherche, Erstellung und Aufbereitung qualitativ hochwertiger multi-modaler Datensätze gehören zu deinen Aufgaben.
- Du erstellst und managst Daten-, Trainings- und Evaluationspipelines in der Cloud.
- Das Fine-Tuning existierender Base Models, wie Qwen und Llama, auf multi-modalen und capability-spezifischen Daten, wie RAG, Tool Calling und agentischem Verhalten, liegt in deinem Verantwortungsbereich.
- In einem agilen Produktentwicklungsteam arbeitest du mit erfahrenen Entwickler*innen aus unterschiedlichsten Disziplinen zusammen.
Wie passt du in unser Team?
- Du bringst umfassende Kenntnisse in der Softwareentwicklung mit Python und dem Trainieren von Deep Learning/Machine Learning Modellen mit.
- Das Verständnis, wie Large Language Models (LLMs) funktionieren und wie sie trainiert werden, gehört zu deinen Stärken.
- Du hast bereits erste praktische Erfahrungen in der Erstellung von Datensätzen, einschließlich Data Processing, Filtering und Augmentation, gesammelt.
- Erfahrung mit Cloudentwicklung, insbesondere mit Databricks und Azure, sind ein Plus.
- Kenntnisse im Finetuning von Large Language Models oder in der Entwicklung von Large Language Models Applikationen sind ebenfalls von Vorteil.