◆◆◆◆◆◆◆ PERL PROGRAMMING LANGUAGE　◆◆◆◆◆◆◆

KAIHATSUGIKEN GROUP
PERL PROGRAMMING LANGUAGE

************************************************************************************ １７　さらに正規表現 ********************** 大文字小文字を無視してマッチさせるにはそんなときは　i オプションを使います。例えば /ab/i にすると "ab""Ab""aB""AB" とマッチします。 ************************* 単語の境界とマッチさせるそんなときは　/b オプションを使います。 book と言う正規表現は　booksore handbook の両方ともにマッチしますが、 /bbook/b にする事によって　book という単語にだけマッチします。 ************************** 繰り返しの回数を指定する * は０回以上 +は一回以上の繰り返しでしたがもっとはっきりと指定する方法があります。 n には数を指定します。 {n} n回 {n,} n回以上 {n,m} n回以上、m回以下となります。例えば、 bo{2.4}nは boon, booon, boooon にマッチします。回数を指定できる訳ね・・・ ****************************** 最長マッチと最短マッチ次のプログラムではどうなるのでしょうか？ use English; $str ="<12><34><56>"; if($str=~/<.*>/{ print"$match\n"; } <,*> というのは<で始まり> で終わっていればその間はどんな文字でも構いません。と言うことは次の６通りが考えられます。 <12><34><56> <12><34> <12> <34><56> <34> <56> となります。さてどれがマッチするのでしょうか？結局　<.*>は　可能な限り長い文字列とマッチしようとします。だから　最も長い文字列でマッチするのは <12><34><56> となります。最短マッチはどうなるのでしょう？ <.*?>にすると可能な限り短い文字列とマッチするようになります。 use English; $str ="<12><34><56>"; if($str=~/<.*?>/{ print"$match\n"; } こうすると一番短くてこれも最初の方が優先されます。だから <12> となるわけです。 ********************************** 繰り返しマッチ文字列の中ノ瀬行き表現にマッチする部分を全て調べたい場合があります。そんなときはgオプションとwhileを使います。 use English; $str="<12><34><56>"; while($str=~/<.*?>/g){ print"$match\n"; } こうすると <12> <34> <56> となります。 ********************** 最後の改行を取り除くすでに出てきましたが最後の改行を取り除く関数は　chomp です。引き数なしの場合は、　$_の最後の改行を取り除きます。引き数で変数を指定するとその変数の最後の改行を取り除きます。　 **************************** 文字列をつなぐ文字列をつないで新しい文字列を作る演算子は　.(ピリオド）です。例えば $b="Cloud"; $c-"Barett"; $t="Tifa"; $str=$b.$c.$t; とすると$strには、$b,$c,$t,をつないだ　"CloudBarettTifa"という文字列が代入されます。 $str="$b$c$t"; としても同じです。便利だねーピリオド演算子は $a.=$b; とすると $a の後ろに　$b を追加します。「.=」は「+=」と同じです。 $a.=$b;は$a=$a.$b; と同じです。 ********************************** 部分文字列を取り出す文字列を取り出すためには　substr を使います。 $substr($str,2,3) となっていれば文字列の２つ目から３つ分を取り出すことを表します。 $substr($str,-8,3) となっていれば文字列の最後から８個目から３つ分を取り出すことを表します。 $substr($str,2,-5) となっていれば文字列の２つ目から最後の文字から５つ目迄を取り出すことを表します。 $substr($str,2) となっていれば　文字列の２つ目から全部を取り出すことを表します。１２３４５６７８９０が文字列だとすれば $substr($str,2,3) 345 $substr($str,-8,3) 345 $substr($str,2,-5) 345 $substr($str,2) 34567890 となります。さらに　substr　は　代入もできます。 $str="0123456789" substr($str,2,3)="*****"; print"$str\n"; とすると $str の部分に*****が代入されます。実行すると全ての文字列の中から最初の２つ目から３つの文字列を取り出すのですから 234を取り出し、***** に代入します。よって 01***56789 となります。 ******************************* 文字の置き換えある文字を全部別の文字に置き換えると言うこともできます。 tr と言う　関数を使います。置き換えもとの文字と置き換え先の文字を指定します。「tr/元の文字/先の文字」と書きます。 $str="abcdefabcdef"; $str=~tr/acd/CEA/; $print"$str\n"; $str=~tr/acd/CEA/; は　acd の文字列を全て　CEA に置き換えると言う意味です。実行すると CbEdAfCbEdAf となります。 *************************************** 同じ文字列を繰り返した文字列を作る文字列x回数で　文字列を回数分だけ繰り返すことが出来ます。 x は　エックスです。例えば $str="abc"x5; となっていれば$strには abcabcabcabcabc が代入されます。 $str="abcx8"; となっていればabc　は８回繰り返して代入されます。 **********************************************