Қазақ тілін жасанды интеллект арқылы дамытудың моделі әзірленіп жатыр

Қазақ тілін жасанды интеллект арқылы дамытудың моделі әзірленіп жатыр
фото: pixabay.com

Астанадағы ақылды жүйелер және жасанды интеллект институты (ISSAI) қазақ тілінің ауқымды моделін (LLM) дайындап жатыр. Бұл туралы "Сапалы Қазақстан" порталы kaz.inform.kz сайтына сілтеме жасап хабарлайды. 

Жоба – Қазақстанда және Орталық Азияда жасанды интеллект мүмкіндіктерін дамытуға арналған.

«KAZ-LLM жүйесі сізбен қазақша сөйлесе алады, сұрақтарға қазақша жауап береді. Қосымша орыс, ағылшын және түрік тілі қатар жүреді. Бұл жобаны биыл сәуірде қолға алдық, қазір шамамен 30 млрд токен жинадық. Қыркүйекте деректерді жинау жұмысын аяқтаймыз, ал айдың ортасында болжамды модель дайын болады деп жоспарлап отырмыз. 16 желтоқсанда жобаны қалың жұртқа жариялаймыз», - деді Назарбаев университеті Ақылды жүйелер және жасанды интеллект институты (ISSAI) директорының операциялық қызметтер жөніндегі орынбасары Ербол Абсалямов баспасөз мәслихатында. 

Қазақ тілін жасанды интеллект арқылы дамытудың моделі әзірленіп жатыр

Фото: Ағыбай Аяпбергенов / Kazinform

Одан әрі қазақ тілінің ауқымды моделін Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрлігі жүзеге асырады. 

«Жүйе википедиядағы мақалалар, жаңалықтар, мемлекеттік сайттар және жалпы қолданымдағы (Common Crawl) дереккөздерден тұрады. Кейінгі 5 жылда ISSAI арнайы қазақ тілі туралы көптеген деректер жинағын әзірледі. Кең ауқымды пайдалануды қамтамасыз ету үшін платформаға тіркелу ұсынса, озық қолданушылар үшін арнайы қолданбалы бағдарламалау интерфейсін (API) ұсынады», - дейді ол. 

университет

Фото: Ағыбай Аяпбергенов / Kazinform

Сондай-ақ ISSAI институты тағы бірнеше жобаны ұсынып отыр: 

– KazEmoTTS – қазақ тілінің эмоционалды дыбысталуына арналған деректер жинағы; 

– Tilmash – қазақ, орыс, ағылшын, түрік, татар және өзбек тілдеріне екі жақты аударма жасауға мүмкіндік беретін жоба; 

– Umay – әйел даусында қазақ тілінде еркін сөйлейтін виртуалды көмекші.