PHP5のSimpleXMLが、rss内に不正な文字列があるとパースエラーを起こしてしまうのだけど、ついに対処法を編み出した。 というか朝思いつきでやったら動いたwwwww $xmlStr = mb_convert_encoding($xmlStr, "SJIS", "UTF-8"); //一度sjisにする $xmlStr = mb_convert_encoding($xmlStr, "UTF-8", "SJIS"); //またutf8に戻す mb_convert_encodingスゴス。 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
」は音が「シ」のものに集中的に文字化けが見られるなど、顕著な規則性がありました。今回の文字化けは、「音」が似通っているという特色はありません。 しかし、それぞれの漢字のShift_JISコードを調べてみると、ある規則性が浮かび上がってきます。Shift_JISコードを調べるには、序論で紹介したようなIMEやことえりの文字一覧表でもいいのですが、ここではURLエンコードを利... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
NFD ペ Array ( [0] => 0000ff8d [1] => 0000ff9f ) NFC ペ Array ( [0] => 0000ff8d [1] => 0000ff9f ) NFKD ヘ● Array ( [0] => 000030d8 [1] => 0000309a ) NFKC ペ Array ( [0] => 000030da ) 互換分解の際に、半角カナの「ヘ」は「ヘ」に、半角カナの半濁点「゚」は半濁点「●」に置き換えられています。正規分解ではこのようなことは起こりません。 他の結果も載せておきましょう。 「ペ」は「ヘ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
- Summary UTF-8 のページから (株) や ローマ数字の I などの文字をメールで送信すると,文字化けする. 文字化けしそうな文字を,ad hoc に機種依存しない文字に変換する. ローマ数字もカッコで括るか,スペースを挿入したほうが良いかも. - Source function replaceText($str){ $ret = $str; $arr = array( '\xE2\x85\xA0' => 'I', '\xE2\x85\xA1' => 'II', '\xE2\x85\xA2' => 'III', '\xE2\x85\xA3' => 'IV', ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
CakePHP のおいしい食べ方: EUC-JPではなく、EUCJP-win!!! お客さんがWindowsを使うと分かっていて、日本語の名前に関するデータ処理をするようなプログラムを書く場合、 $str = mb_convert_encoding($str, "EUC-JP", "UTF-8"); なんてやっちゃだめです。 $str = mb_convert_encoding($str, "EUCJP-win", "UTF-8"); としないと、あとできっと、顧客からクレームが来ます。 知らずに中で使っていて、まさにご指摘いただき... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ref:PHPの文字化けを本気で解決する - ぎじゅっやさん via:よくきたはてダ - 惜しいが間違っている 上鍵さんからツッコミが入ってますが、別の点を。 先ほどの例の時にも書いたが、PHPには内部エンコードという概念は存在しない。ではmbstring.internal_encodingとは何なのか。これは mbstring関数のデフォルトエンコード なだけである。 PHPの文字化けを本気で解決する - ぎじ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 エンコード・デコードは全て手動でやるのが最も安全らしい。合わせて参照→http://d.hatena.ne.jp/elf/20070214/1171381343、http://d.hatena.ne.jp/odz/20070215/1171555360 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
設定内容の確認のため、以下のスクリプトを保存してブラウザで表示してみてください。「mbstring」セクションの「Master Value」の値がphp.iniの設定値と同じになっているか確認してください。私はコメントを外すのを忘れていて、ちゃんと設定されてないことがありました。 <?php phpinfo() ?> ここまで大丈夫なら、次のスクリプトを実行してみます。テストする文字列は「ソリュー... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
PHP に関する一般的なチュートリアルや参考資料に見られる、Hello World などほとんどすべての例は、限定された形式の英語を「自然言語」での通信に使うことを想定しています。しかし PHP は、それ以上のことができます。適切な方法を使えば、PHP は英語での名前や外来語にときどき現れるアクセント記号付きの文字を処理できるだけではなく、ドイツ語やロシア語、中国語、日本... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
ジュンヤです。 5分でわかる PHP で書かれた Web サービスの国際化 に続いて gettext の話。 以下、英語で「Hello」、日本語で「こんにちは」と表示する簡単なプログラム hello.php です。 <?php $language = 'en'; if (ereg('ja', $_SERVER['HTTP_ACCEPT_LANGUAGE'])) { $language = 'ja_JP'; } // Set locale and default domain. putenv("LANG=$language"); setlocale(LC_ALL, $language); $domain = 'messages'; bindtextdomain($domain, "/var/www/html/locale"); text... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
R*PADのメンテナンスしたときに使った方法をメモ。いつも忘れちゃうので。 PHPでソースコードはUTF-8で書きたいけど、このページだけShift-JISで出力したいってときありますよね(ケータイサイト作っているときとか)。 その場合、以下のような方法でやっています(いつもながら青い人に教えてもらいました!感謝!)。 <?php header('Content-Type: text/html; charset=Shift_JIS'); ob_st... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
PHPでiモード用XHTMLを出力する際のトラブルと、トラブル対策としてPHPにパッチを当てる方法を紹介します。 ディノの過去の案件で実際にあったことなのですが、携帯向けにXHTMLのコンテンツを表示する際に、PHPで意外なトラブルが発生することがあります。具体的には、下記の状況でmb_output_handlerによる文字エンコーディング変換が効きません。 ドコモ携帯向けにXHTMLを出力する C... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
- Summary 設定すべき項目は以下. ;; Disable Output Buffering output_buffering = Off ;; Set HTTP header charset ; default_charset = EUC-JP ;; Set default language to Japanese mbstring.language = Japanese ;; HTTP input encoding translation is enabled. mbstring.encoding_translation = off ;; Set HTTP input encoding conversion to auto mbstring.http_input = pass ;; Convert HTTP output to EUC-JP mbstring.http_output = pass ;; Set internal encoding to EUC-JP mbstring.internal_encoding = EUC-JP ;; Do not... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
『 HTTPクライアントの作成で大変お世話になりましたm(__)m 』 [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
|
最近PostgreSQL、MySQL両方にSJISエンコーディングを利用している際のエスケープ方法の問題を修正がリリースされています。この件は単純に「データベースシステムにセキュリティ上の脆弱性があった」と言う問題ではなく「アプリケーションの作り方を変える必要性」を提起した問題です。 PostgreSQL、MySQLの脆弱性は特にSJIS等、マルチバイト文字に\が含まれる文字エンコーディング... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|
table.yamaoka_ { border-collapse: collapse; } table.yamaoka_ th, table.yamaoka_ td { border: 1px solid #fff; } yamaokaです。 PHPで日本語を扱う場合、mbstringモジュールを利用する場合が多いと思います。 日本語に特有の機能(カタカナの全角/半角変換など)も備わっていて、とても便利です。 しかし、日本以外ではmbstringモジュールはあまり利用されていないようです。 代わりに利用されているのがiconvモジ... [ 詳細 ] [ 関連 ] [ ニコニコ風 ]
|