Large Language Model
LLM, Duży Model Językowy
Definicja
Zaawansowany system sztucznej inteligencji oparty na głębokim uczeniu maszynowym (najczęściej wykorzystujący architekturę sieci neuronowych typu Transformer). Przymiotnik "duży" odnosi się tutaj do dwóch aspektów: gigantycznych zbiorów danych tekstowych, na których model był trenowany (książki, cały dostępny internet, kod źródłowy), oraz liczby parametrów (często liczonych w miliardach), które pozwalają modelowi zapamiętywać i przetwarzać skomplikowane wzorce językowe.
W praktyce działanie LLM opiera się na zaawansowanej statystyce i probabilistyce. Model analizuje wprowadzony tekst i na podstawie wyuczonych wzorców przewiduje, jaki element (słowo lub fragment słowa, tzw. token) powinien pojawić się jako następny. Dzięki temu LLM nie tylko potrafi prowadzić płynną konwersację, ale także streszczać teksty, tłumaczyć języki, pisać kreatywne eseje, a nawet tworzyć działający kod programistyczny.
Najpopularniejszymi przykładami LLM są modele z rodziny GPT (stworzone przez OpenAI), Gemini (Google), Claude (Anthropic) czy Llama (Meta). Choć modele te potrafią generować odpowiedzi brzmiące bardzo naturalnie i autorytatywnie, nie posiadają one świadomości ani "zrozumienia" faktów w ludzkim sensie, co czasem prowadzi do generowania błędnych informacji, zjawiska znane jako halucynacje.