統計や機械学習に関するプログラミングではPythonやRが用いられることが多いですが、近年Juliaも注目を集めています。そこで当シリーズではJuliaの基本構文からライブラリの用い方などについて取りまとめます。当記事ではJuliaにおける正規表現の取り扱いについて取りまとめを行いました。
・Julia入門
https://www.hello-statisticians.com/julia
・Julia 1.8 Documentation
https://docs.julialang.org/en/v1/
正規表現
正規表現の概要
正規表現は文字列の検索などの際に用いられる表現方法で、たとえば「Jで始まりgで終わる文字列」のように文字列のパターンを表す目的で用いられます。
正規表現の定義
「Jで始まりgで終わる文字列」の正規表現は下記のように作成できます。
regex = r"J.*g"
println(regex)
println(typeof(regex))・実行結果
r"J.*g"
Regexmatch関数
正規表現を用いて文字列のパターンマッチングを行うにあたっては、下記のようにmatch関数を用いれば良いです。
regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(m)・実行結果
RegexMatch("JuliaLang")ここでmatch関数の戻り値はRegexMatch型のオブジェクトで得られ、RegexMatch型のオブジェクトは下記のようにmatchやoffsetメソッドを実行できることも合わせて抑えておくと良いです。
regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(typeof(m))
println(m.match)
println(m.offset)・実行結果
RegexMatch
JuliaLang
1参考
・Julia 1.8 Documentation
https://docs.julialang.org/en/v1/