日本語の漢字6万字すべてがコンピューターで使用可能に

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、1万字しか扱うことができなかった。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターで日本語の漢字すべてを使用可能になったという。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。
続きはソース元から
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html

スポンサードリンク

5:名無しさん@涙目です。 2017/12/24(日) 19:34:34.39 ID:dDxGM9hKO.net

さいとうさんとわたなべさんだけに朗報

11:名無しさん@涙目です。 2017/12/24(日) 19:35:46.70 ID:iPWlb7CZ0.net

苗字旧字体だから助かるわ

31:名無しさん@涙目です。 2017/12/24(日) 19:41:35.96 ID:7yqUuuIy0.net

草なぎも変換できるな

42:名無しさん@涙目です。 2017/12/24(日) 19:46:51.44 ID:KGHpsw+70.net

これは良くやった!と褒めてあげたい

7:名無しさん@涙目です。 2017/12/24(日) 19:35:11.20 ID:eG4oDqE90.net

フォントは誰が用意するんだ?

19:名無しさん@涙目です。 2017/12/24(日) 19:37:27.36 ID:yFdZ8/Xz0.net

>>7
なんか大変そうだよな

22:名無しさん@涙目です。 2017/12/24(日) 19:38:16.42 ID:a7y1PqvO0.net

>>19
フォントはIPAフォントってのがすでに作成済みだったはず。

44:名無しさん@涙目です。 2017/12/24(日) 19:47:20.23 ID:KGHpsw+70.net

>>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。

8:名無しさん@涙目です。 2017/12/24(日) 19:35:17.23 ID:FMfFaCUQ0.net

もうUTF8だけで良くね?

208:名無しさん@涙目です。 2017/12/24(日) 23:00:50.23 ID:53B2XxAY0.net

>>8
unicodeとutf-8みたいな文字コードは違います

こういうのはunicodeの異体字セレクタ使うんだけど、
エンコードはまた別の話で関係ない

233:名無しさん@涙目です。 2017/12/25(月) 00:53:10.94 ID:O7NNyeel0.net

>>208
ソースの記事読むとユニコードの事を言ってるね

にしてもIPAのフォント入れないと文字化けするだろうし、
フォント入れると殆ど使わない漢字の為に従来の6倍のメモリが必要になるし、ニッチな需要のために15年もかけて税金投入してやる事かね

250:名無しさん@涙目です。 2017/12/25(月) 03:02:41.25 ID:6ntf3IJ30.net

>>233
フォントは各ベンダーが切他社にり替えられない既得権みたいなもんだからね。
正直統一してくれた方が凄く助かる。
統一規格ならフォントの配信もしなくて助かる。
ただ、ホントに切り替えられるかは疑問あるけどね。

14:名無しさん@涙目です。 2017/12/24(日) 19:36:08.47 ID:Rvu7LWqJ0.net

84画のこれもコード化したんか?

24:名無しさん@涙目です。 2017/12/24(日) 19:39:38.03 ID:zI17Wdf70.net

>>14
シューティングのキャラでしょ
これが3つずつヒューって落ちて攻めてくるんだよね?

59:名無しさん@涙目です。 2017/12/24(日) 19:56:37.49 ID:ofcPRJma0.net

>>24
www

99:名無しさん@涙目です。 2017/12/24(日) 20:25:15.45 ID:N8RaGJQq0.net

>>24
ギャラクシアンかよ

87:名無しさん@涙目です。 2017/12/24(日) 20:14:07.91 ID:OUrTXgjD0.net

>>14
いつ使うんだよコレwww

139:名無しさん@涙目です。 2017/12/24(日) 21:01:35.82 ID:dWszBWt80.net

>>14
wiki見たらちゃんとunicodeで今後出る予定になってて、超漢字だとすでに登録済みってのに驚いた

20:名無しさん@涙目です。 2017/12/24(日) 19:37:51.25 ID:aBrzcYD90.net

>>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ

54:名無しさん@涙目です。 2017/12/24(日) 19:52:47.18 ID:FUprDAwy0.net

>>20
コンピュータに人間が合わせろというのは昭和50年代の思想だぞw

21:名無しさん@涙目です。 2017/12/24(日) 19:37:53.04 ID:Au1+Vg0i0.net

漢検一級に出てくるような漢字は廃止しろよ
変換したくても読めねーから面倒くせーよ

23:名無しさん@涙目です。 2017/12/24(日) 19:38:29.39 ID:LfXOtTaM0.net

どうせデータ連携で化けるんだから余計な事しなくても
なきゃないで終わりなのに

28:名無しさん@涙目です。 2017/12/24(日) 19:40:21.49 ID:Jp6EfYB50.net

こんなバカげた文字に付き合わされる欧米人も大変だな

26:名無しさん@涙目です。 2017/12/24(日) 19:39:59.94 ID:RrvIlUnz0.net

しょうもない事に予算使うな

27:名無しさん@涙目です。 2017/12/24(日) 19:40:02.47 ID:QUrXN0bm0.net

あれ、、1日15文字くらいのお仕事?

32:名無しさん@涙目です。 2017/12/24(日) 19:41:59.10 ID:0A0zdG1s0.net

こんなもんに15年もかかる未開の土人国

37:名無しさん@涙目です。 2017/12/24(日) 19:44:38.33 ID:GEDJ9G/x0.net

>>32
貴重な天下り先だからな。
半年で終わらせたら儲けられない。

これからも日本のITは各駅停車だぜ!

35:名無しさん@涙目です。 2017/12/24(日) 19:44:05.42 ID:ezxnPrY90.net

フォントデザイナーの災厄

50:名無しさん@涙目です。 2017/12/24(日) 19:51:19.20 ID:kKWrYEwV0.net

馬鹿じゃねえの

60:名無しさん@涙目です。 2017/12/24(日) 19:56:53.20 ID:5gE6HO8y0.net

その点26文字で済むアルファベットは優秀だな

61:名無しさん@涙目です。 2017/12/24(日) 19:57:01.51 ID:5YvbZiqz0.net

中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか?
姓は全部旧字で書く動きになって余計ややこしくなりそう。
元号と一緒、害悪でしかない。

64:名無しさん@涙目です。 2017/12/24(日) 19:59:29.85 ID:HZCapToz0.net

常用漢字とか人名漢字とかの制限の方をきつくしてくれればそんな大事業は要らなかったんじゃないのか

65:名無しさん@涙目です。 2017/12/24(日) 19:59:51.23 ID:SaxS7Jg00.net

ついに三国志ヲタの苦労が報われる日が来たか

75:名無しさん@涙目です。 2017/12/24(日) 20:05:12.06 ID:wc81z2Ql0.net

これで厨二臭い文章が捗るねw

137:名無しさん@涙目です。 2017/12/24(日) 21:00:29.17 ID:kZiapEmr0.net

DQNネームがはかどるなw

76:名無しさん@涙目です。 2017/12/24(日) 20:06:02.99 ID:xCfLLm8X0.net

努力だけ評価する

72:名無しさん@涙目です。 2017/12/24(日) 20:03:30.78 ID:wc81z2Ql0.net

普通の人が使えるようになるのは何時だろう?

221:名無しさん@涙目です。 2017/12/24(日) 23:41:00.88 ID:aNnW6q2t0.net

変換してから大量の似た字の選択肢で迷う事に

80:名無しさん@涙目です。 2017/12/24(日) 20:09:33.99 ID:PTc95fiA0.net

これは簡単な方に統一すべきでは?
高と梯子高、浜と濱と賓と眉浜とか斉藤とか種類がありすぎて困るから簡単なのにしろよ
でなきゃ手間が掛かりすぎて困る

81:名無しさん@涙目です。 2017/12/24(日) 20:10:12.28 ID:hZTBNa4k0.net

サイトウとワタナベいい加減にせえよ

88:名無しさん@涙目です。 2017/12/24(日) 20:14:54.52 ID:ezxnPrY90.net

>>81
渡辺は漢字の組み合わせも多いうえ、わたなべ、わたべ、わたのべ、わたりべとか読み方も数種類あって本当に迷惑

83:名無しさん@涙目です。 2017/12/24(日) 20:11:38.86 ID:uUlXb0qA0.net

そういや漢字って新しい奴増えないの?
略字とかじゃなくて

94:名無しさん@涙目です。 2017/12/24(日) 20:20:31.45 ID:M5EhgwlT0.net

>>83
江戸時代でもアクロバットな読み方は続々考え出されたけど新しい漢字は数えるほどだな
必要に応じて作られてきたもんだから外来語をそのまま表記するようになった今
新しい熟語はできても字は滅多なことじゃできないだろ

120:名無しさん@涙目です。 2017/12/24(日) 20:45:55.47 ID:u2bHZ85P0.net

15年www

101:名無しさん@涙目です。 2017/12/24(日) 20:27:03.83 ID:XTBhpnum0.net

Googleに頼めば半月でできたのに

133:名無しさん@涙目です。 2017/12/24(日) 20:57:39.76 ID:ysefhXjL0.net

さすが役人。
仕事遅すぎ。

113:名無しさん@涙目です。 2017/12/24(日) 20:39:40.93 ID:TmcKCGwb0.net

こんなあほな作業AIにやらせとけ

125:名無しさん@涙目です。 2017/12/24(日) 20:49:59.18 ID:j/gaQn1O0.net

何のためにマイナンバーがあるのか
数字でええやん
被る問題とか解消する

136:名無しさん@涙目です。 2017/12/24(日) 21:00:12.72 ID:ghtmL6NB0.net

こんなアホなことに労力をかけてどうする
それより意味もなく増やした人名漢字を常用漢字まで減らせば済む話だろ

141:名無しさん@涙目です。 2017/12/24(日) 21:04:08.68 ID:ri1Jh9l70.net

ばかじゃねぇのIPA、こんなつかわねー漢字は数減らしてまとめろよ。

217:名無しさん@涙目です。 2017/12/24(日) 23:35:31.69 ID:VJS+gsPC0.net

なんとか3万ぐらいで収まらんのか。。よく分からんが。

228:名無しさん@涙目です。 2017/12/25(月) 00:07:22.65 ID:7iJKbxX00.net

大漢和辞典とか見てると
どこで使われてたんだよ?いつ使うんだよ?
って漢字が山ほどあるよな。

220:名無しさん@涙目です。 2017/12/24(日) 23:39:38.94 ID:8RjqLS6L0.net

今度は中国の漢字コンプだな

242:名無しさん@涙目です。 2017/12/25(月) 01:35:39.54 ID:hCSCRofL0.net

草なぎ剛歓喜

元スレ: http://hayabusa3.2ch.sc/test/read.cgi/news/1514111550/