アカウント名:
パスワード:
何より文字自体に意味をもってるのはデカいと思う。
漢字は情報処理と相性が悪いのがダメ。
入力するのも出力するのも見るのも大変。JIS漢字の「驫」「鸞」ちゃんと見えてますか?文字と読みが一致しないのでソート目的によっては読みまで入力する必要あり。文字コードが増えるためにデータとして圧縮するのも不利。文字コードの問題から扱える文字数に制限が出る。同音異字のため入力した後に期待した文字が出ているか確認が必要。
いいなと思うところは知らない文字でも意味を推測しやすいのと、文字としての芸術にもなりうる美しさぐらいか?
違うよ。漢字の本当に大きなメリットは造語力と、文字数あたりの情報密度。
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。日本語の場合はそれが漢字にあたるのだが、ローマ字に移行してしまうと漢字の新語生成能力が失われてしまう。そして漢語は少ない文字数で複雑な概念を表すことが出来るので、いったん覚えてしまえば文書を読むのがとても楽になる。ちなみに私は米国育ちで、語彙力と作文力は日英だいたい同じくらいなのだけど、読む速度だけは昔から日本語の方がずっと上。
日本語をローマ字表記にしよう、なんてのはあまりにもバカげていて、まともに議論をする気にもなれない。日本語を放り捨てて英語を公用語にしよう、という方がまだマシだ。(その案ももちろん反対だけど)
経験上、英語と日本語で同じ内容なら、UTF-8の場合日本語はだいたい1.5倍のバイト数になる。描画幅だとだいたい同じくらいかちょっと多めの領域が必要になる。だからたしかに文字数あたりの情報密度は高いかな。ちょっとだけ。
漢字は読むのが楽という印象をうけるのはわかるけど、読みやすく感じる=理解できているではないのに注意が必要だね。漢字だけひろって読んでいるつもりになってしまうことがある。
出版物はあまり漢字を使わない傾向にある(常用漢字だけとかじゃなくて、ひらく場合が多い)けど、なんかエビデンスがあってやってるんだろうかね。
ローマ字については慣れの問題だから、おれもやだよ。
バイト数? アスキー文字ならUTF-8で1バイト。基本多言語面ならUTF-8で3バイト。
でも、元コメの言う情報密度はコンピュータでの話じゃなくて、読むにしても紙の書籍とかでの話では?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
※ただしPHPを除く -- あるAdmin
漢字って優れてるよね (スコア:2)
何より文字自体に意味をもってるのはデカいと思う。
日本語における漢字のダメなところ (スコア:0)
漢字は情報処理と相性が悪いのがダメ。
入力するのも出力するのも見るのも大変。
JIS漢字の「驫」「鸞」ちゃんと見えてますか?
文字と読みが一致しないのでソート目的によっては読みまで入力する必要あり。
文字コードが増えるためにデータとして圧縮するのも不利。
文字コードの問題から扱える文字数に制限が出る。
同音異字のため入力した後に期待した文字が出ているか確認が必要。
いいなと思うところは
知らない文字でも意味を推測しやすいのと、文字としての芸術にもなりうる美しさぐらいか?
Re: (スコア:0)
違うよ。漢字の本当に大きなメリットは造語力と、文字数あたりの情報密度。
英語で知らない言葉の意味を類推したり新しい言葉を作ったりするにはギリシャ語やラテン語をある程度勉強していないといけない。日本語の場合はそれが漢字にあたるのだが、ローマ字に移行してしまうと漢字の新語生成能力が失われてしまう。
そして漢語は少ない文字数で複雑な概念を表すことが出来るので、いったん覚えてしまえば文書を読むのがとても楽になる。ちなみに私は米国育ちで、語彙力と作文力は日英だいたい同じくらいなのだけど、読む速度だけは昔から日本語の方がずっと上。
日本語をローマ字表記にしよう、なんてのはあまりにもバカげていて、まともに議論をする気にもなれない。日本語を放り捨てて英語を公用語にしよう、という方がまだマシだ。(その案ももちろん反対だけど)
Re: (スコア:0)
経験上、英語と日本語で同じ内容なら、UTF-8の場合日本語はだいたい1.5倍のバイト数になる。
描画幅だとだいたい同じくらいかちょっと多めの領域が必要になる。
だからたしかに文字数あたりの情報密度は高いかな。ちょっとだけ。
漢字は読むのが楽という印象をうけるのはわかるけど、読みやすく感じる=理解できている
ではないのに注意が必要だね。漢字だけひろって読んでいるつもりになってしまうことがある。
出版物はあまり漢字を使わない傾向にある(常用漢字だけとかじゃなくて、ひらく場合が多い)けど、
なんかエビデンスがあってやってるんだろうかね。
ローマ字については慣れの問題だから、おれもやだよ。
Re:日本語における漢字のダメなところ (スコア:0)
バイト数? アスキー文字ならUTF-8で1バイト。基本多言語面ならUTF-8で3バイト。
でも、元コメの言う情報密度はコンピュータでの話じゃなくて、読むにしても紙の書籍とかでの話では?