Мустапаева Айгул Жолбарысовна
Должность:не указана
Группа:Посетители
Страна:Республика Казахстан
Регион:не указан
31.01.2015
0
293
0

Открытый урок по Информатике

Сканердің көмегімен мәтіннің бейнесін графикалық файл ретінде қабылдап алсақ жеткілікті. Әлпетте, мұндай мәтінмен жұмыс жасау мүмкін емес, кез келген сканерленген бейне сияқты, мәтіні бар бет графикалық файл – жай ғана бейне болып ұсынылады. Мәтінді оқыға және баспаға шығаруға болады, алайда өңдеуге және форматтауға болмайды. Құжатты мәтіндік файл түрінде алу үшін, мәтінді тану жұмысыны жүргізу қажет, яғни, бейненің графикалық элементтерін мәтіндік символдардың тізбегіне айналдыру қажет.

Графикалық бейнелерді мәтіге айналдыру үшін арнайы мәтінді тану программалары бар (Optical Character Recognition - OCR).

Қазіргі заманғы  OCR көп әрекет жасай білуі керек: тек ғана терілген мәтінді танымай, сонымен қатар, қолдан жазылған жазбаларды да тану білуі керек. Құрамында бірнеше тілде жазылған мәтінді дұрыс тани білу, кестелерді дұрыс тану да жатады. Және де ең бастысы – тек ғана терілген мәтінді ғана емес, шынайылықтан алыс жатқан мәтінді тани білуі керек. Мысалы, сарғайып қалған  газеттегі кеспелерді немесе үшінші машинажазбалардың көшірмесін тану сияқтылар. Сонымен қатар, алынған нәтижені ұтымды мәтіндік редаторда(ms word) да сақтау да аса маңызды болған жөн.

Яғни, терілген мәтіннің электронды, өңдеуге дайын нұсқасын алу үшін, OCR  программасында жеке амалдардан тұратын тізбекті орындау керек.

Алдымен, беттегі мәтіннің орналасу құрылымын анықтау қажет: бағандарды, кестелерді, бейнелерді  ерекшелеу. Ары қарай ерекшеленген фрагменттерді мәтінге айналдыру қажет.  

Ең көп таралған оптикалық тану жүйелері ішінде мысалы, ABBYY FineReader и CuneiForm от Cognitive.  

Салық декларацияларын толтыруда, халықты тіркеуді жүргізуде, т.б. түрлі өрістері бар бланктер қолданылады. Қолжазбалалы мәтіндер осы оптикалық тану жүйлереі арқылы танылып,  компьютер базасына енгізіледі.

 

Қолжазбаларды тану жүйелері. Apple  фирмасымен 1990 жылы шығарылған алғаш қалта компьютерлерімен қатар, қолжазбаларды тану жүйелері құрыла бастады. Мұндай жүйелер қалта компьютерлері экранына арнайы қаламмен жазылған мәтінді мәтіндік компьютерлік құжатқа айналдырады. 

Открытый урок по Информатике Открытый урок по Информатике
Комментарии пользователей /0/
Комментариев нет...
Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
Наши услуги



Мы в соц. сетях

    Персональные сообщения