“文字 图片”识别技术是怎样的?
2020-11-21 04:20:02
“文字”在计算机中是一个个/一串串对应的符号编码规则定义下的底层元素信息,在很多编码规范下它们可以相互转换(就像翻译),但并不能确保转换质量的优质性,即便是最先进的语言字符规范标准,其间也会有误差,况且多次转换,可能失真很严重,不管是字符还是图片,都包含对应的信息,这些信息由于规则碰撞,最终被理解,这也就是识别的来由。
不同的识别技术和识别标准理解不同,就像两个人同时看到一样东西绝对理解是不一样的,但计算机搞这种事情意味着是组织的不同,在相同组织下,由于计算机是电信号的传输,设备的相同性,所以基本不会失真(我们下载的微信,误差率可以不计的)。
关键在于该组织制定的判读规则,它往往是找重复性的信息为抓手,或者抓一些信息与数据库中的匹配,然后择取一些它们认为主要的信息,比如网络词频、句频,甚至它还能进行更高程度的理解,比如文章的规范,如果你连用两个句号就可能认为你用错了标点。其实就是所谓的匹配技术,如果你刚好被“匹配到”,那么就是怎样怎样,所以你是活在“定义”里,规则里,程序化里,意识里,你有可能会被采取行为、引导你的行为、甚至你也能改变它,定义自我,改变他人,这样的相互的关系。
阅读剩余内容