インフラ

地方自治体における外字問題とその標準化に向けた取り組み

doiken

こんにちは。土居です。地方自治体の業務における一つの大きな課題に、文字の標準化があります。今日はこの重要なトピックについて、皆さんと共に考えていきたいと思います。

現在、全国の地方自治体において基幹業務システムの標準化に向けた取り組みが進められています。その一環としてシステム間のデータ連携における文字の標準化が必要になってきますが、地方自治体には「外字」と呼ばれる特別な文字が非常に多く存在することが課題となっています。まずはこの「外字」の概念について説明いたします。

外字とは

戸籍や住民基本台帳で利用するため、地方自治体が独自に作成した文字のことを「外字」と呼びます。「外字」は200万文字以上あるとも言われ、各地のベンダーが管理できているものに限っても約160万文字※が存在します。これは一般的に馴染み深い「常用漢字(約2,100文字)」や、それに実用上頻度の高い文字を加えた「JIS X 0213漢字(約10,000文字)」とも比較にならない文字数です。

外字の維持には作成の手間や、連携時の文字化けなど、考慮すべきことが多くあるためコストがかかります。しかし、様々な理由から外字を単純に無くすことは難しいです。例えば、氏名の外字にアイデンティティを持つ人は一定割合存在し、配慮が必要となります。

文字情報基盤 拡張セット MJ+とは

このような外字の課題に対応するため、総務省は文字情報整備作業を実施し、外字を可能な限り絞り込んでデジタル庁指定の文字コードに当てはめることで基幹業務システム間で利用できる様にしました。これが文字情報基盤とその拡張文字セットの「MJ+」です。

mj+.png (53.1 kB)

外字を約160万文字から約10万文字以下程度にまで絞り込んでいます。(これでも相当な文字数ではありますが)

今後、標準化された基幹業務システム間においては、「MJ+」のみを使ってデータ連携を行います。

同定マップと代替マップ

標準化後のデータ連携には、従来の基幹業務システムで利用されていた文字を「MJ+」へ同定する「同定マップ」の作成と、さらに標準化の対象外となるシステムや外部システムとの連携のために必要となる「JIS X 0213」への「MJ+」との紐付けを行う「代替マップ」の作成が必要となります。現在、「同定マップ」と「代替マップ」はデジタル庁において作成とテストが進められており、2024年3月末に各自治体に提供される予定です。

今後の標準化後の運用

必要なツールが完成する2024年4月移行に本格的な文字管理の運用が始まることになりますが、地方自治体は引き続き、円滑な導入や運用開始後に発生する課題に取り組む必要があります。例えば、MJ+は今後も増加する見込みであるため、MJ+への文字追加の対応には検討が求められます。

まとめ

ここまで地方自治体の基幹業務システムにおける文字の標準化について、外字に係る文字セットの観点からご紹介させていただきました。諸外国においては基本的に公的文書に使用される文字は限定されており、この様な問題は日本独自の文化背景によるものです。システム移行において難しい課題ではあるものの、私は非常に興味深く感じています。

参考

文字要件説明資料(デジタル庁 デジタル社会共通機能グループ地方業務システム基盤チーム)

AUTHOR
どいけん
どいけん
記事URLをコピーしました