Қазақстандық ғалымдар жаңа бағдарлама ойлап тапты

173

Қазақ Ұлттық техникалық университеті ғылыми зертханасының мамандары қазақ тіліндегі мәтінді оптикалық тану кешенін ойлап тапты, деп хабарлайды, BusinessNews.kz  «Қазақстан» ұлттық арнасына сілтеме жасап.

ҚазҰТУ ғылыми зертхана маманы Қайрат Бостанбековтың айтуынша, жоба мақсаты – кез-келген кітапта не құжатта болсын, қазақ тіліндегі мәтінді сканерден өткізіп, сол алынған суретті Word сияқты бағдарламадағы құжатқа айналдыру боп табылады. «Сурет болып «қақиып» тұрған сөздерді енді қалағаныңызша өзгерте аласыз. Қазір бұл кешен құжатта кеткен қателерді 98 пайызға дейін түзете алады», – дейді ол.

Өңдеу суперкомпьютерде 3 кезеңнен өтеді. Біріншісі – оптикалық тану. Ол кезде бағдарлама мәтіндегі әр әріпті таниды. Екінші кезеңде, морфологиялық талдау жасайды. Яғни, бірінші кезеңде табылған қате сөздерді түзейді. Үшіншісі – морфологиялық-семантикалық сараптама. Қазақ тілінің синтаксисіне байланысты кеткен қателер жөнделеді. Осының бәрі ар болғаны 3-4 секундта жүзеге асырылады.