Алғашқы цифрлық қазақ дауыстары пайда болды. Бағдарламаны әзірлеген Назарбаев Университетінің ғалымдары мұны толыққанды дауыс көмекшісін ("қазақ Siri" делік) құру үшін маңызды қадам деп санайды. Исеке мен Раяның мүмкіндіктері туралы Tengrinews.kz материалында.
Алғашқы цифрлық қазақ дауыстары пайда болды. Бағдарламаны әзірлеген Назарбаев Университетінің ғалымдары мұны толыққанды дауыс көмекшісін ("қазақ Siri" делік) құру үшін маңызды қадам деп санайды. Исеке мен Раяның мүмкіндіктері туралы Tengrinews.kz материалында.
Назарбаев Университетінің зияткерлік жүйелер және жасанды интеллект институтының (ISSAI) ғалымдары ер мен әйелдің цифрлық қазақша дауысын жасады.
Ер адам даусының есімі Исеке, ал әйелдікі - Рая. Бұл синтетикалық дауыстардың негізі болған екі диктордың есімінен шыққан. Олар цифрлық Исеке мен Рая жалпыға таныс немесе белгісіз я тіпті жоқ сөздерді оңай айтуы үшін ауқымды жұмыс жасады, көптеген сөзді, сөз тіркестерін, дыбыстарды, әріптер мен сандарды дыбыстады.
Исеке мен Рая қазақша сөйлейтін алғашқы сандық дауыс болады. Оларды мына жерден тыңдап, сынап көре аласыз. Әзірге бұл демо-нұсқа.
Негізі бұл жай ғана қазақша мәтінді дыбыстау технологиясы, бірақ Қазақстанда мұндай алғаш рет жасалып отыр, оны әзірлеу өте үлкен жұмысты талап етеді.
"Бұл жоба бойынша біз 2020 жылдың ортасында жұмыс істей бастадық. Жұмыстың негізгі бөлігі деректерді жинау және өңдеу болды, бұл көптеген есептеу мен адами ресурстарды, көп уақытты қажет етеді. Ең күрделісі, ең маңызды бөлігі үлкен деректермен жұмыс істеу, деректердің әсіресе ашық көздерде болмауы қазақ тіліндегі сөздерді синтездеу технологиясының дамуына кедергі келтірді. Қалған уақытты код жазуға және модельдерді оқытуға жұмсадық", - деді ISSAI постдокторантын әзірлеушілердің бірі Ерболат Хасанов.
Исеке мен Раяны "қазақ Siri" деуге бола ма?
Бұл цифрлық қазақ сөзін естігенде бірінші кезекте ойға келетін мәселе. Бірақ мұнда бәрі оңай емес екені белгілі болды.
"Бізде мәтінді аудиоға айналдырады, ал Сири сұрақтарға жауап беру, ұсыныстар айту және әртүрлі әрекет орындау үшін дыбысталған сұрауларды қолданады. Сириде әртүрлі өзара байланысты модульдер кешені бар. Мәтінді аудиоға түрлендіру оның бір бөлігі ғана. Осыған байланысты біздің жобаны "қазақ Siri" деп атауға әлі ерте. Бұған қарамастан, біз жобамызды "қазақ Siri" жасаудағы маңызды қадам деп санаймыз", - деп бөлісті Ерболат Хасанов.
Айта кетейік, Назарбаев Университетінің ғалымдары жинаған және өңдеген барлық деректер базасы, алынған тәжірибе мен білім, әзірленген технологиялар - осының барлығы ашық түрде қолжетімді. Жиналған мәліметтермен бірге олар дайындаған коды мен алдын-ала оқытылған модельдерін бөліседі. Басқа әзірлеушілер оны қазақстандық жасанды интеллект технологияларын одан әрі дамытып, қазақ тілін ілгерілетуге пайдалануы үшін ғалымдар бүкіл тәжірибесін ашуды ұйғарды. Осы деректердің көмегімен кез келген адам өзіне ыңғайлы технологияларды қолдана отырып, қазақ тілінің синтезаторын құра алады.
Исеке мен Раяның пайдасы неде?
"Мәтінді сөйлететін технологиялар навигация, жарнама, ақылды көмекшілер мен сөйлеуді қолдайтын басқа құрылғылар сияқты көптеген қосымшаға қажет. Олар көру қабілеті нашар адамдарға жаңа мүмкіндік ашады және адамның визуалды, тактильді интерфейстерді қажет етпестен көлікпен өзара әрекеттесуін қамтамасыз етеді. Демек, бұл технология кез келген тіл үшін қажет және пайдалы", - деді Ерболат Хасанов.
Бұл әлі соңы емес. Бұған дейін біз Назарбаев Университетінің ғалымдары қазақша сөзді автомат түрде тануға мүмкіндік бергенін технология жасағанын жазған болатынбыз. Ол үшін олар екі мың дауысты жазып, өңдеді, қазақ тіліндегі аудио деректердің үлкен базасын жинады.
"ISSAI-де 2022 жылдың ортасына қарай осыған ұқсас барлық технологияны қазақ тілінде жасау бойынша жол картасы бар. Біз бұл технологияларды "Қазақстанның жұмсақ (ағылшынша Soft) цифрлық инфрақұрылымы" деп атаймыз", - деді Ерболат Хасанов.
Әзірше Исекенің синтетикалық даусымен дыбысталған Қорқыт ата туралы видеоны тыңдай аласыз.
Сілтемесіз жаңалық оқисыз ба? Онда "ВКонтакте" желісінде парақшамызға тіркеліңіз!