Od OpenAI GPT-4 až po Google PalM 2, hlavné jazykové modely dominujú technologickým titulkom. Každý nový model sľubuje, že bude lepší a výkonnejší ako ten predchádzajúci, pričom niekedy prekoná akúkoľvek existujúcu konkurenciu.
Množstvo existujúcich modelov však nespomaľuje nástup nových. Teraz materská spoločnosť Facebooku, Meta, vydala Llama 2, nový výkonný jazykový model. Čo je však na hre Llama 2 jedinečné? Ako sa Llama 2 líši od GPT-4, PaLM 2 a Claude 2 a prečo by vás to malo zaujímať?
Čo je Llama 2?
Llama 2, veľký jazykový model, je produktom aliancie medzi Meta a Microsoft, dvoma konkurenčnými technologickými gigantmi v popredí výskumu umelej inteligencie (AI) . Je to nástupca jazykového modelu Meta's Llama 1, ktorý bol vydaný v prvom štvrťroku 2023.
Dá sa povedať, že Meta je ekvivalentom PaLM 2 od Google, OpenAI GPT-4 a Claude 2 od Anthropic. Bola trénovaná na obrovskom dátovom súbore verejne dostupných internetových dát, pričom využívala výhodu nového a rozmanitejšieho dátového súboru ako ten, ktorý bol použitý na trénovanie lámy 1. lama 2 je trénovaná s o 40 % väčším množstvom údajov ako jej predchodca a má dvojnásobnú dĺžku kontextu (4k).
Ak ste mali možnosť komunikovať s Llamou 1 v minulosti, ale neboli ste príliš ohromení jej výstupom, Llama 2 je lepšia ako jej predchodca a môže byť presne to, čo potrebujete. Ako však Llama 2 konkuruje ostatným konkurentom?
Ako Llama 2 prekonáva svojich konkurentov?
Po prvé, Llama 2 je projekt s otvoreným zdrojovým kódom. To znamená, že Meta zverejňuje celý model, takže ho môže použiť ktokoľvek na vytváranie nových modelov alebo aplikácií. Ak porovnáte Llama 2 s inými hlavnými modelmi jazyka s otvoreným zdrojovým kódom, ako sú Falcon alebo MBT, uvidíte, že ich prekoná v niekoľkých metrikách. Dá sa povedať, že Llama 2 je jedným z najvýkonnejších open source veľkých jazykových modelov na dnešnom trhu.
Llama 2 však stratila svoju výhodu, keď čelila konkurentom, ako sú modely GPT od OpenAI a rodina modelov AI PalM od Googlu. Pri zvládaní úloh vyžadujúcich kreativitu je Llama 2 trochu iná. V závislosti od variantu, ktorý testujete, možno nebudete mať rovnaký výstup, aký získate z modelov Anthropic a OpenAI.
Llama 2 je v prvom rade len „základný model“ a nie „vylepšená“ možnosť. Platformové modely sú veľké jazykové modely vytvorené s ohľadom na budúcu adaptabilitu. Nie sú vyladené pre žiadnu konkrétnu oblasť, ale sú skonštruované tak, aby dokázali zvládnuť širokú škálu úloh, aj keď niekedy s obmedzenými schopnosťami.
Na druhej strane vylepšený model je model platformy, ktorý je upravený tak, aby sa zvýšila jeho účinnosť v konkrétnej oblasti. Je to ako vziať model platformy ako GPT a spresniť ho na ChatGPT, aby ho mohla používať verejnosť.
Ako teraz používať Llamu 2
Aj keď Llama 2 nie je k dispozícii na verejnej platforme, ako je ChatGPT , model môžete stále získať tak, že si stiahnete kópiu a spustíte ju lokálne alebo použijete prístup cez verziu Face hostenú v cloude Hugging.
Ak chcete získať prístup k Llame na Hugging Face, jednoducho otvorte príslušný odkaz Hugging Face nižšie a začnite písať výzvy pre AI chatbota.
- 7B parametre Llama-2 chat
- 13B parametre Llama-2 chat
- 70B parametre Llama-2 chat
Vyššie uvedené modely Llama boli vylepšené pre konverzačné aplikácie, takže toto je najbližšie k ChatGPT, ktorý získate pre Llama-2. Nie ste si istí, ktorú verziu vyskúšať? Článok odporúča možnosť 3, 70B parametre Llama-2 chat. Stále sa môžete hrať so všetkými tromi modelmi, aby ste zistili, ktorý z nich najlepšie vyhovuje vašim jedinečným potrebám.
V článku boli použité parametre Meta 70B Llama-2 chat a výsledky sú pôsobivé. Aby autor otestoval kreativitu a zmysel pre humor modelky, dal jej charakteristickú skúšku kreativity a irónie. Autor požiadal model AI, aby simuloval rozhovor medzi dvoma ľuďmi, ktorí debatujú o výhodách letu do vesmíru, a toto je výsledok.
Ďalšie:
A nakoniec:
Nevystihuje všetky podrobnosti nášho sprievodcu, ale humor je pôsobivý.
Na druhej strane, ak máte technické znalosti na spustenie modelu Llama lokálne na vašom počítači, môžete požiadať o prístup k modelu pomocou formulára Meta. Po zadaní vášho mena, e-mailu, miesta a názvu organizácie Meta skontroluje vašu žiadosť, po čom bude prístup zamietnutý alebo povolený v priebehu niekoľkých hodín až 2 dní.