【Julia入門】Juliaの基本事項⑧ Juliaにおける正規表現の取り扱い

統計や機械学習に関するプログラミングではPythonRが用いられることが多いですが、近年Juliaも注目を集めています。そこで当シリーズではJuliaの基本構文からライブラリの用い方などについて取りまとめます。当記事ではJuliaにおける正規表現の取り扱いについて取りまとめを行いました。

Julia入門
https://www.hello-statisticians.com/julia

Julia 1.8 Documentation
https://docs.julialang.org/en/v1/

正規表現

正規表現の概要

正規表現は文字列の検索などの際に用いられる表現方法で、たとえば「Jで始まりgで終わる文字列」のように文字列のパターンを表す目的で用いられます。

正規表現の定義

Jで始まりgで終わる文字列」の正規表現は下記のように作成できます。

regex = r"J.*g"
println(regex)
println(typeof(regex))

・実行結果

r"J.*g"
Regex

match関数

正規表現を用いて文字列のパターンマッチングを行うにあたっては、下記のようにmatch関数を用いれば良いです。

regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(m)

・実行結果

RegexMatch("JuliaLang")

ここでmatch関数の戻り値はRegexMatch型のオブジェクトで得られ、RegexMatch型のオブジェクトは下記のようにmatchoffsetメソッドを実行できることも合わせて抑えておくと良いです。

regex = r"J.*g"
m = match(regex, "JuliaLang is the best")
println(typeof(m))
println(m.match)
println(m.offset)

・実行結果

RegexMatch
JuliaLang
1

参考

Julia 1.8 Documentation
https://docs.julialang.org/en/v1/