過去にいくつか書いた 「shift-jis と utf-8 の混在問題」について書いた記事へのリンクをここにまとめておく。
タグにするのもイマイチ検索と相性が悪いので、リンクリストにした方が良いと思う。
文字コードの混在問題について課題と解決策を解説
日本語文字コード(utf,shift_jis,eucとBOM:encoding)を一気に解説する
業務担当者などのIT素人さん向けに文字コードの基礎について解説してる。
Windowsはshift-jisからutf-8へ移行できるのか、検証してみよう!
Windowsデスクトップ環境で、テキストの文字コードを全てutf-8にする事が可能なのか簡単に調べてみた。
今後 shift-jis でシステム開発する場合のデメリットと、shift-jis で開発すべきか、utf-8 で開発すべきかの判断基準を書いてみた。
Windows環境で文字コードをutf-8で開発する場合、shift-jisテキストとの共存が必要になる。その点での注意点を書いた。
業務ユーザーが自分で手元のPCで手軽に文字コードを変換する方法を説明する。
XMLの文字エンコーディングはUTF-8とUTF-16が基本です。
データの保存に非常に多く使われている XML の文字エンコーディングの規格について、一般の非情技(非ITエンジニア)向けに解説しています。
システム間連携に多く使われている JSON の文字エンコーディングの規格について、一般の非情技(非ITエンジニア)向けに解説しています。
.NETコンソール・アプリの文字エンコーディングはデフォルト設定にした方が良い
.NETコンソール・アプリのコマンドメッセージ表示とコンソール入力に使用する文字エンコーディングはどうすべきか検証した。
コマンドプロンプトとPowerShellとUbuntuのbashについて、検証した。
C# サンプルコード
BOMの有無を判別し、UTFを読み分ける StreamReader のサンプルコード
.net C# の StreamReader でBOMの有無を判定し、UTFを読み分けるサンプルコードを書いた。
shift-jis と utf-8 が混在する現場で使えるはずだ。
BOM有り又はBOMなしのテキスト出力する StreamWriter のサンプルコード
.net C# の StreamWriter でBOMの有るテキストと無いテキストの作成方法のサンプルコードを書いた。
これと同じサンプルは検索すれば沢山出てくる。
StreamReader の次いでに載せた。
BOMの有無を判別し、UTFを読み分ける UWP非同期API読み書き処理 のサンプルコード
UWP C# の非同期API読み書き処理で、BOMの有無を判別し、shift-jis も utf-8 も読み書きできるコードサンプルを書いた。
簡単なテキストエディタのようなプログラム。
Java サンプルコード
BOMの有無を判別し、UTFを読み分ける InputStreamReader のサンプルコード
Java の InputStreamReader でBOMの有無を判定し、UTFを読み分けるサンプルコードを書いた。
C# の StreamReader のサンプルをそのまま Java に書き換えた。
BOM有りBOMなしのテキスト出力する OutputStreamWriter のサンプルコード
Java の OutputStreamWriter でBOMの有るテキストと無いテキストの作成方法のサンプルコードを書いた。
C# の StreamWriter のサンプルをそのまま Java に書き換えた。
BOMの有無を識別し、UTFを識別して Java の Files で読み書きするサンプルコード
Java の Files でBOMの有るテキストと無いテキストの読み書き方法のサンプルコードを書いた。
バイナリモードで読み書きする。
Java の BOMInputStream による shift-jis と UTF の読み分け処理のサンプルコード
Java の Apache Commons の BOMInputStream を用いた、shift-jis と BOM有りの UTF_8, UTF_16LE, UTF_16BE, UTF_32LE, UTF_32BE を読み分ける処理のサンプルコードを掲載する。
文字エンコーディング判定処理 サンプルコード
C# による、BOMなしテキストファイルの文字コード(Encoding)判定処理のサンプルコード
C# で書いた、BOMなしテキストファイルの文字エンコーディングが何か判別するプログラムのサンプルコード。
バイナリモードで読む。
Javaによる、BOMなしテキストファイルの文字コード(Encoding)判定処理のサンプルコード
Java で書いた、BOMなしテキストファイルの文字エンコーディングが何か判別するプログラムのサンプルコード。C#版をJavaに書き換えたもの。
PHP サンプルコード
BOMの有無を判別し、UTFを読み分ける PHP7.4 のサンプルコード
PHP版のBOMテキスト読み込み処理のサンプル。PHPのUTF-16LEに関するバグの解説もしている。
BOM有りBOMなしのテキスト出力する PHP7.4 のサンプルコード
PHP版のBOMテキスト書き込み処理のサンプル。
今後、同様のテーマで記事を書いた場合は、ここに追加していくつもりです。