Subscribe feed

Google навучыўся адрозніваць словы на малюнках

1 лістапада 2008

Кампанія Google распрацавала сістэму аптычнага распазнання тэксту. Яна дазваляе пошукавіку адрозніваць тэкст на адсканаваных малюнках. Аб гэтым паведамляецца ў афіцыйным блогу Google.

У цяперашні час Google здольны распазнаць тэкст на малюнках, захаваных у фармаце PDF. Аб планах Google па пашырэнні магчымасцяў сістэмы не паведамляецца.

Пошукавік ужо пачаткаў індэксаваць PDF-файлы. Найбольшую складанасць уяўляе пошук па старых адсканаваных дакументах, дзе папера, напрыклад, выпацканая слядамі ад кубка з кавы, альбо маюцца розныя пазнакі, зробленыя ад рукі.

Раней Google запусціў у эксперыментальным рэжыме сэрвіс Google Audio Indexing, распазнавальны гукавую дарожку ў відэакліпах. Ён канвертуе гук у тэкст і індэксуе апошні.

Акрамя таго, у пачатку верасня Google паведаміў аб планах па размяшчэнні ў інтэрнэце адсканаваных старонак старых газет і часопісаў. Яны будуць змешчаныя ў навінавы архіў пошукавіка і з'явяцца ў выніках пошукавай выдачы.


рэкамендуем прачытаць таксама

Каментаванне не дазволенае.

Rambler's Top100