- 人生で一番衝撃的だった出来事他
- 吉田正尚 打率.474(19-9)2本 13打点 OPS1.414他
- マクラーレン、F1サウジアラビアGPの週末は悲惨な結果に...他
- 【悲報】ネパール人、もはや何も信じられないwwwwwwwwwwww他
- 村神様にごめんなさいは?他
- 【朗報】ライザとかいうふとももがエッチなだけのアトリエ、ついにアニメ化されてしまう…他
- 【画像】メキシコ代表さん、大谷にハグされて勃起してしまったのを世界中でネタにされるwww他
- 【速報】岸田首相、今日ウクライナ電撃訪問「ゼレンスキー大統領と首脳会談」他
- 【朗報】日本、メキシコに逆転勝利。村上がサヨナラ他
- 【永遠の謎】女が彼氏と別れても大して引きずらない理由他
――『正規表現辞典 改訂新版』は目的別の検索ができるリファレンスですが、正規表現の歴史や背景についても解説されています。今回は佐藤さんに本書についてお尋ねしますが、まずはご自身のことを教えてください。
佐藤:勤務先はいわゆるSIerですので、各種システムの企画・構築を主業務としています。主に担当しているのは企業向けのアプリケーション開発基盤の構築や、個別システムに対するアプリケーション・アーキテクチャの立案といった分野ですね。
世間的には「アーキテクト」と呼ばれる職種になりますが、私自身はプログラマーとして個別の問題と向き合い、頭を絞るほうが好きです。
――仕事では正規表現をどう活用されているのでしょうか。
佐藤:個別のアプリケーションにおける入力値検証などに利用することはもちろん、アプリケーションやミドルウェアのトラブルシュートにおけるログの分析や、既存データのクレンジングなどに活用しています。
ログ分析では必要なログのみを抜き出す、あるいは不要な部分を刈り取るために正規表現は欠かせません。データのクレンジングでは不要なデータを排除する、あるいは不正なデータを正しい形式に整形するといった作業が必要となりますが、このような局面でも正規表現はそのパワーを存分に発揮してくれます。
読みやすさやメンテナンスのしやすさで差がつく
――プログラマー(開発者)として、正規表現を使いこなすのと使いこなさないのとでは、どんな差がつきますか?
佐藤:テキストを相手にする処理では、正規表現を活用することで簡潔かつ分かりやすい記述が可能となるケースが多々あります。正規表現をうまく使えないプログラマーは、ちょっとした処理でもループでテキストを文字単位に分割し、複雑な条件分岐を処理中に記述してしまいます。
このようなプログラムは確かに動作するかもしれませんが、読みやすさやメンテナンスのしやすさという観点で見れば大きなマイナスとなるでしょう。
「正規表現を使いこなす」という質問からすると拍子抜けされるかもしれませんが、正規表現を使って解決すべき現場の問題の多くは、基本正規表現と拡張正規表現の範囲でも十分まかなえます。
ですので、本当に基本的な部分をちゃんと理解するだけでもプログラマーとしては大きなアドバンテージになります。大切なのは個々のメタキャラクタの意味をきちんと押さえること、そして実践を繰り返すことでしょう。最初はとっつきにくく見える正規表現も、慣れてくるうちに自然と記述できるようになります。
――開発者以外でも正規表現を使えることでどのような利点がありますか?
佐藤:現在は開発者以外の方でも、各種のクラウドサービスなどのツールやリソースを活用して生産性の向上、さらにはビジネス上の成果を求められる時代です。処理対象の指示や結果の加工に正規表現が必要とされる、あるいは正規表現を使うことでより柔軟な処理を実現できるといった局面は今後も増えてくるはずです。
たとえば、RPA(Robotic Process Automation)ではExcelやPDFファイルから特定のデータのみを抜き出し、妥当性を判断し、加工したうえで最終的な結果を得るといったことが普通に行われます。このような処理は、それこそ正規表現が最も得意とする領域です。
結果に辿りつく過程を理解してほしい
――2005年に出版された初版と、この改訂版が出る間に、どのような変化がありましたか?
佐藤:本書の前書きにも書きましたが、Unicodeが文字コードの標準的地位を獲得したことです。文字の選択はUnicodeのプロパティにもとづいて行われるため、たとえば1文字の数字を表す「\d」はUS-ASCII以外の数字にもマッチすることが当然になりつつあります。
また、絵文字のように複数のコードポイントを消費して目に見える1文字を表すケースもこれまで以上に増えました。本書でも可能な限り、これらのポイントについて説明しています。
https://codezine.jp/article/detail/10855
引用元:https://egg.5ch.net/test/read.cgi/bizplus/1527843649/
これ
全てにおいて言えるな。
分数の割り算が出来ない大学生が多いらしい。
図書館の検索で正規表現?
前方一致、後方一致、あいまい検索くらいでいいんじゃない
ほんとそれ
特に最短一致はよく使うので
何とかして欲しい
改行しないでダラダラ書けばいいんじゃね
?
環境と言語と目的は?
1行分だけならとか三項演算子あるけどなるべくやめとけ
iOSのサーバ証明書バグみたいになる
ちんこ!
ただそれは自分だけの世界ならではの話
他人が書いた正規表現はメンテの時に混乱する
特に一行で収めようと頑張ってる人が書いた正規表現は鬼門
一週間前に自分で書いたやつが理解できないときあるもんな
用途を添えて別のテキストへ蓄積
ドキュメント作れよ。
正規表現そのものには、コメント入れられないからね
そこは不便
一致や置換の例でも、書いとくかね?
語尾に英字は全部消す
はくちっぽいので
老いたな
yy/MM/dd kk:mm:ss の日付の日だけ欲しいときに、いろいろ処理するのと
正規表現を使うのとでは、まあ確かに正規表現のほうがわかりやすそうではある
処理でやるのだと、” “でsplitして~とかやるんだろうなw
手入力だと文字が全角だったり、「HH:MM:SS」じゃなくて「H時M分」とか「H時」
だったり、区切り文字が「コロン(:)」が「セミコロン(;)」だったり、前後に空白文字
や、余分な改行文字(EXCELのセル入力あるある)が入っていたりとかフツーなんだが?
お前のところの「普通」なんて知らんがな
本当にアドバンテージになるの?
今こそ転職じゃい
そういうことを聞いているレベルじゃ
お前さんの役には立たないよ
これは鉄則だよね
RFCのメアドテストはギリギリだろうか?
表現しきれないなら使えるわけないだろ
馬鹿か
お前が言いたいのは
式が複雑になりすぎる時は利用を断念することも検討しろ
という事だろ
簡単な日本語も使えない奴は何やっても駄目
- 【画像まとめ】ケーキ食べるたびに顎の笑顔思い出して戻してほしい他
- 【Vtuber】翔んで埼玉に出るのも時間の問題や他
- 【Vtuber】切り抜きチャンネルがランキング入ってるのなんかうーんってなるな 元配信を見ろ他
- 【画像】YouTube視聴ランキング→Z世代「Vtuber!任天堂!」、50代「乃木坂!ウェザーニュース!」他
- 【Colabo】仁藤夢乃、バスカフェ中止撤回の抗議活動を呼びかけ→ほとんど集まらず逆効果にwwwww他
- 【情強】最近の「AliExpress」」、ガチのマジで1週間以内に届く他
- サードインパクトにトラウマ植え付けられすぎた葛城ミサト…などのつぶやき他
- 【悲報】ワイ、マッチングアプリで2回連続ドタキャンの洗礼を受ける他
- 【Vtuber】ねるちゃんはブレないな他
- 【悲報】SNS「5万人の弱男と1人の大谷、どちらを助ける?」→炎上へ...他