Кампанія Google распрацавала сістэму аптычнага распазнання тэксту. Яна дазваляе пошукавіку адрозніваць тэкст на адсканаваных малюнках. Аб гэтым паведамляецца ў афіцыйным блогу Google.
У цяперашні час Google здольны распазнаць тэкст на малюнках, захаваных у фармаце PDF. Аб планах Google па пашырэнні магчымасцяў сістэмы не паведамляецца.
Пошукавік ужо пачаткаў індэксаваць PDF-файлы. Найбольшую складанасць уяўляе пошук па старых адсканаваных дакументах, дзе папера, напрыклад, выпацканая слядамі ад кубка з кавы, альбо маюцца розныя пазнакі, зробленыя ад рукі.
Раней Google запусціў у эксперыментальным рэжыме сэрвіс Google Audio Indexing, распазнавальны гукавую дарожку ў відэакліпах. Ён канвертуе гук у тэкст і індэксуе апошні.
Акрамя таго, у пачатку верасня Google паведаміў аб планах па размяшчэнні ў інтэрнэце адсканаваных старонак старых газет і часопісаў. Яны будуць змешчаныя ў навінавы архіў пошукавіка і з'явяцца ў выніках пошукавай выдачы.
Google навучыўся адрозніваць словы на малюнках
1 лістапада 2008
Каментароў (0)