自力で日本語のsplit

perl5.0003などでutf8モジュールも使えないときに,split(//,$str)を
正しく行いたい。EUCの場合2byteは0x8Eで始まることが前提らしいので
以下のようなコードで確認してみた。

my $s="abc:日本語:desu";
print "--------------------- \n";
print "s:$s \n";
print "--------------------- \n";
for(my $i=0;$i my $n = substr($s,$i,1);
my $ord= ord($n);
if($ord>hex("0x8E")){
my $n2 = substr($s,$i,2);
my $ord = hex($n2);
print "n2:$i:[$n2]:$ord \n";
$i=$i+1;
}else{
print "n::$n:$ord\n";
}
}
print "--------------------- \n";

なんとなくできているっぽい。