UTF-8 BOM付きにUTF-8N,EUC-JPにSHIFTJIS変換。

UTF-8 BOM付きにUTF-8N,EUC-JPにSHIFTJIS変換。

このBLOGはwordpressNucleusというCMSブログツールを使用しています。
Nucleusは進化するBLOGで、経年によって脆弱面を改編し新たにプロミングされたソフトをバージョンアップを繰り返しながら、またはプラグインを追加しながら自分なりにアレンジ出来る、かなり高機能なBLOGなんですが…

 

そのプラグインとかの追加などで少々問題が…

 

というのは、このNucleusだけでなく、サイトの運営管理をする人は、みな同じ問題に直面していると思える。

で、この表題のUTF-8 BOM付きにUTF-8N,EUC-JPSHIFTJIS変換ということについて。

まず、このNucleusは、UTF-8版とEUC-JP版の2種類があり、それぞれの保存について別々に準備されている。
圧縮ファイルを解凍すると、そのファイルのひとつをテキストエディタで開くと、すべてSHIFT-JISと表示される。

これは、SHIFT-JISのようだが、例えばUTF-8であるならば、ちゃんとUTFー8のものとなっている。
これは、1バイトしか書きこまれていないものはSHIFT-JISで表示され、2バイト(日本語が書き込まれている)はUTF-8と表示されるということで…

当然、EUC版も同じ考えで良いという事が、Nucleus CMS Japanのサポートフォーラムに書かれている。

なるほど、それなら理解できるのだが、ちょっとした失敗をしてしまった。

 

 

その失敗とは、CSSファイル。

そう、これでSHIFT-JISでもちゃんとしたもので…
これこそ、真のSHIFT-JISでの保管で、それからはBLOGのバランスは崩れ…

あとは、書くまい! (^^:)

 

で、このSHIFT-JISを確かめようと、テキストエディタの読み込みから保存までをあれこれテストしてみた。
UTF-8保存したものを、ワンクッションおいて再度読み込むと2バイトのものはUTF-8で表示、そして1バイトのものは、ちゃんとSHIFT-JISで表示されたので、納得できるものであった。

しかし、エディタでUTF-8またはEUC読み込みをしてもSHIFTーJISと表示されたものをどうやってUTF-8とかEUCなのかを確認するか?という疑問があった。
それで、あれこれ弄ってはみたが、テキストエディタでは不可能。(実は確認が出来ないだけ…)
出来れば新しいファイルにコピペをするしかないようで。
(これはシェアウエアでも同じ結果が出る。)

しかし、Googleでサーチすると意外なエディタがこれを可能にしてくれるということがわかった。

それは、Winに付属されている、メモ帳なんです。

しかし、普通に全てのファイルとしたらUTF-8では呼び出せない、それでUNICOAD→UTF-8とファイルをクリックしながらすると、ちゃんと呼び出せました。

あとは、いつも使っているエディタでSHIFT-JIS表示というのを再確認すればOK!
(もし、この方法を使用する場合は自己責任でお願いします。これは確認のためだけだけど)
*ここまでの調べは、エディタでテキスト文章を書いていたために起こった現象の検証です。よって、エディタをUTF-8またはEUCどちらかの扱い(ブログ専用とか)としている場合はこの問題は多分ないだろう…

 

あと、UTF-8 BOM付きとUTF-8Nとの違いは、このNucleusはUTF-8Nでのアップロードが正規なのでその保管をすれば問題ないようです。(Win.Mac共…多分)

 

<<2006.04.17追記>>
この問題は、テキストエディタで小説とかを書いたりメルマガを書いていた場合に起きた現象です。
よって、この無料とか有料エディタでは、読み込みをUTF-8 or UTF-8Nで呼び込めばちゃんとその表示になります。これは、メモ帳の呼び出しも同じです。
よって、エディタの設定を自分のサイト等のエンコードに合わせて呼び出し及び保存をお勧めします。
また、この呼び込み保存をチェックしてないと文字化けの現象が発生する事もあると思います。…