絵文字削除

PHPで絵文字対処

Formに絵文字入力されると困ってしまう場合4バイト文字を削除でいったん対処。その他いい方法あるんでしょうか。

$text = "EMOJI"; // 😾とかの絵文字
$text = preg_replace('/[\xF0-\xF7][\x80-\xBF][\x80-\xBF][\x80-\xBF]/', '', $text);

猫ちゃん絵文字はWordpressの場合は「😾」はエディタ上では

😾

自動的に変換されますね。
内部的にどうやっているのか全然調べていませんが、Disable Emojisという絵文字を無効化するプラグインの中身を調べると本体調べるより早そう。

Javascriptで絵文字対処

PHPと同じ正規表現だとなんか動かなくて、これだと動きました。

var re = val.match(/\ud83c[\udf00-\udfff]|\ud83d[\udc00-\ude4f]|\ud83d[\ude80-\udeff]|\ud7c9[\ude00-\udeff]|[\u2600-\u27BF]/gi);
Last update: 2017.07.20 (木)