アカウント名:
パスワード:
CAPTCHA を自動突破したり適当に描いた動物の線画を、モフモフの毛並みのある画像にしてくれたり、果ては「俺の嫁」を合成したり、現代のAI技術には感心しきりですが、
OCR ってまだ役に立つレベルじゃないのかしら?この業者が使っているソフトが古すぎなのか。
多分、年金データは元が手書き。
人間の場合は、読めなかったら相談するんだけど、OCRは「読めたこと」にすることが多いからねぇ。
なるほど。でもAIの最高人材があれば今なら手書きだって、かなり解釈しそうな勢い・・・。
汚い字でも人間だと読めますものねー。くせ字を学習したり、なんか類推するのだろう。
綺麗な草書体でかかれてれば、手書きでも認識できるようになるかもしれないけど、単に汚い字や誤字脱字の類は難しいよ。(点や横棒が一個多いとか少ないとか、点を打つ位置がおかしいとか、それこそいくらでも)
最後は行間を読む仕事になるから、んなもん学習でどうにかなるわけない。
#いるんだよなあ。AIに夢見すぎな人って。
いやあ、むしろこの手の認識こそ、機械学習が活きてくる分野だと思いますけどね。膨大なサンプルデータがあれば、「人間が考える認識方法」を軽く上回ってくることもありうるわけで。
ただ、こと「日本人の名前」に関しては、文字種が多すぎることの方が問題じゃないかな。
よくある間違いから生まれた異体字と、同じ間違いを犯した文字はどう区別するのか、て時点で完全な認識はどだい不可能なんですよ。崩れすぎた文字から癖を読み解き書こうとしていた文字を復元するとか、人間には難しい部分の補完が出来る可能性はあるけれど、やはり限界がある。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人は巨人ファンでA型で眼鏡をかけている -- あるハッカー
OCR って取り残されている? (スコア:1)
CAPTCHA を自動突破したり適当に描いた動物の線画を、モフモフの毛並みのある画像にしてくれたり、果ては「俺の嫁」を合成したり、現代のAI技術には感心しきりですが、
OCR ってまだ役に立つレベルじゃないのかしら?
この業者が使っているソフトが古すぎなのか。
Re: (スコア:2)
多分、年金データは元が手書き。
人間の場合は、読めなかったら相談するんだけど、OCRは「読めたこと」にすることが多いからねぇ。
Re: (スコア:1)
なるほど。でもAIの最高人材があれば
今なら手書きだって、かなり解釈しそうな勢い・・・。
汚い字でも人間だと読めますものねー。
くせ字を学習したり、なんか類推するのだろう。
Re:OCR って取り残されている? (スコア:0)
綺麗な草書体でかかれてれば、手書きでも認識できるようになるかもしれないけど、
単に汚い字や誤字脱字の類は難しいよ。
(点や横棒が一個多いとか少ないとか、点を打つ位置がおかしいとか、それこそいくらでも)
最後は行間を読む仕事になるから、んなもん学習でどうにかなるわけない。
#いるんだよなあ。AIに夢見すぎな人って。
Re: (スコア:0)
いやあ、むしろこの手の認識こそ、機械学習が活きてくる分野だと思いますけどね。
膨大なサンプルデータがあれば、「人間が考える認識方法」を軽く上回ってくることもありうるわけで。
ただ、こと「日本人の名前」に関しては、文字種が多すぎることの方が問題じゃないかな。
Re: (スコア:0)
よくある間違いから生まれた異体字と、同じ間違いを犯した文字はどう区別するのか、て時点で完全な認識はどだい不可能なんですよ。
崩れすぎた文字から癖を読み解き書こうとしていた文字を復元するとか、人間には難しい部分の補完が出来る可能性はあるけれど、やはり限界がある。