統計や機械学習に関するプログラミングではPython
やR
が用いられることが多いですが、近年Julia
も注目を集めています。そこで当シリーズではJulia
の基本構文からライブラリの用い方などについて取りまとめます。当記事ではJulia
における正規表現の取り扱いについて取りまとめを行いました。
・Julia
入門
https://www.hello-statisticians.com/julia
・Julia 1.8 Documentation
https://docs.julialang.org/en/v1/
正規表現
正規表現の概要
正規表現は文字列の検索などの際に用いられる表現方法で、たとえば「J
で始まりg
で終わる文字列」のように文字列のパターンを表す目的で用いられます。
正規表現の定義
「J
で始まりg
で終わる文字列」の正規表現は下記のように作成できます。
regex = r"J.*g"
println(regex)
println(typeof(regex))
・実行結果
r"J.*g"
Regex
match関数
正規表現を用いて文字列のパターンマッチングを行うにあたっては、下記のようにmatch
関数を用いれば良いです。
regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(m)
・実行結果
RegexMatch("JuliaLang")
ここでmatch
関数の戻り値はRegexMatch
型のオブジェクトで得られ、RegexMatch
型のオブジェクトは下記のようにmatch
やoffset
メソッドを実行できることも合わせて抑えておくと良いです。
regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(typeof(m))
println(m.match)
println(m.offset)
・実行結果
RegexMatch
JuliaLang
1
参考
・Julia 1.8 Documentation
https://docs.julialang.org/en/v1/