{"id":1261,"date":"2024-10-09T12:10:16","date_gmt":"2024-10-09T10:10:16","guid":{"rendered":"https:\/\/www.lan-wan-telecom.de\/?p=1261"},"modified":"2024-10-09T12:23:48","modified_gmt":"2024-10-09T10:23:48","slug":"das-potenzial-alternativer-sprachmodelle","status":"publish","type":"post","link":"https:\/\/www.lan-wan-telecom.de\/index.php\/2024\/10\/09\/das-potenzial-alternativer-sprachmodelle\/","title":{"rendered":"Das Potenzial alternativer Sprachmodelle"},"content":{"rendered":"<p>Wer von K\u00fcnstlicher Intelligenz spricht, meint in der Regel Large Language Models (LLM). Dabei laufen Unternehmen Gefahr, das gro\u00dfe Potenzial von Sprachmodellen abseits von LLMs zu \u00fcbersehen. Der globale Technikanbieter Zoho erkl\u00e4rt, warum sich ein Blick auf die gesamte KI-Spannweite lohnt. W\u00e4hrend die prominenten Vertreter der gro\u00dfen Sprachmodelle \u2013 allen voran GPT-4, Midjourney, DALL-E oder Googles Cybersecurity-LLM Sec-PaLM \u2013 im Scheinwerferlicht der \u00d6ffentlichkeit stehen, erfahren ihre kleineren Verwandten vergleichsweise wenig Aufmerksamkeit. Zu Unrecht, denn leichtgewichtige und spezialisierte Modelle bergen f\u00fcr Unternehmen ein immenses Potenzial:<\/p>\n<p><strong>Narrow Language Models:<\/strong> Sie sind kleine, leichtgewichtige Modelle, die sich auf einen eng umrissenen Anwendungsbereich und spezifische Aufgaben spezialisieren. F\u00fcr diesen Zweck umfassen ihre Trainingsdaten auch nur Informationen aus einem bestimmen Themenbereich, etwa Cybersecurity, Finance oder einzelnen Produktgruppen eines Unternehmens. In der Praxis erstrecken sich die Anwendungsbeispiele von der Analyse juristischer Gesetzestexte \u00fcber branchenspezifische \u00dcbersetzungen bis zur Erkennung von Text in Bildern.<\/p>\n<p><strong>Small Language Models (SLM):<\/strong> Im Gegensatz zu den ressourcenintensiven LLMs umfassen kleine Sprachmodelle wenige Milliarden Parameter, in der Regel zwischen drei und sieben. Im Vergleich: Gro\u00dfe Modelle verarbeiten mehr als 50 Milliarden Parameter. Dadurch k\u00f6nnen SLMs leichter f\u00fcr bestimmte Aufgaben trainiert werden, eignen sich f\u00fcr den Einsatz auf Ger\u00e4ten mit begrenzten Ressourcen, da sie weniger Rechenleistung und Speicherplatz ben\u00f6tigen, und verursachen geringere Kosten. Damit eignen sich SMLs f\u00fcr eine Vielzahl von Anwendungsf\u00e4llen, etwa im Bereich von IoT-Ger\u00e4ten, Echtzeit\u00fcbersetzungen, Transkriptionen oder Spracherkennung.<\/p>\n<p><strong>Medium Language Models (MLM):<\/strong> Der nicht fest etablierte Begriff der MLMs dient zur Beschreibung von Modellen, die im Bereich von etwa 20 bis 50 Milliarden Parametern arbeiten. Sie bieten damit eine gute Balance zwischen Komplexit\u00e4t, Leistung und Ressourcenverbrauch. MLMs kommen dann zum Einsatz, wenn eine h\u00f6here Genauigkeit und Spezialisierung als bei SLMs n\u00f6tig, die Rechenleistung allerdings begrenzt ist. Medium Language Models erm\u00f6glichen zum Beispiel eine intelligente Arbeit mit Texten, bei der Nutzer Fragen zu einem Dokument stellen k\u00f6nnen oder inhaltliche Analysen zu umfangreichen Textdokumenten ben\u00f6tigen. Auch die Beantwortung von h\u00e4ufig gestellten Fragen im Bereich Kundensupport, die Umwandlung von Sprache zu Text oder das Erkennen von Emotionen und Meinung im Kontext der Analyse von Kundenfeedback sind m\u00f6gliche Anwendungsbeispiele.<\/p>\n<p>Aktuelle LLMs wie ChatGPT sind f\u00fcr die breite Nutzung konzipiert, was zu Einschr\u00e4nkungen bei der Anwendung in Unternehmen und hohen Kosten f\u00fchren kann. Die notwendige kontextuelle Intelligenz entsteht erst, wenn KI-Modelle verschiedener Gr\u00f6\u00dfen auf Gesch\u00e4ftsprozesse angewendet werden. Das Wissen, das dabei gewonnen wird, ist f\u00fcr Unternehmen \u00e4u\u00dferst wichtig und kann zu Kosteneinsparungen f\u00fchren.<\/p>\n<p>\u201eDas wahre Potenzial der vielen verschiedenen Sprachmodelle liegt in der M\u00f6glichkeit, sie miteinander zu kombinieren\u201c, erkl\u00e4rt Sridhar Iyengar, Managing Director von Zoho Europe. \u201eDurch das Zusammenspiel der einzelnen L\u00f6sungen lassen sich auch komplexe Prozesse effizient gestalten, zum Beispiel bei der Verarbeitung von fotografierten Dokumenten: Ein Narrow Model extrahiert den Text aus dem Bild, ein SLM analysiert die relevanten Informationen, die dann ein MLM auf Anomalien \u00fcberpr\u00fcft. Dieser Stacked-Model-Ansatz macht auch den Datenschutz und die Datensicherheit robuster.\u201c<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Wer von K\u00fcnstlicher Intelligenz spricht, meint in der Regel Large Language Models (LLM). Dabei laufen Unternehmen Gefahr, das gro\u00dfe Potenzial von Sprachmodellen abseits von LLMs zu \u00fcbersehen. Der globale Technikanbieter Zoho erkl\u00e4rt, warum sich ein Blick auf die gesamte KI-Spannweite lohnt. W\u00e4hrend die prominenten Vertreter der gro\u00dfen Sprachmodelle \u2013 allen voran GPT-4, Midjourney, DALL-E oder [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,12,11],"tags":[],"class_list":["post-1261","post","type-post","status-publish","format-standard","hentry","category-networks","category-pc-software","category-security"],"_links":{"self":[{"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/posts\/1261","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/comments?post=1261"}],"version-history":[{"count":3,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/posts\/1261\/revisions"}],"predecessor-version":[{"id":1264,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/posts\/1261\/revisions\/1264"}],"wp:attachment":[{"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/media?parent=1261"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/categories?post=1261"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lan-wan-telecom.de\/index.php\/wp-json\/wp\/v2\/tags?post=1261"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}