正規表現で「HTMLコードの「見出し行」以外を削除する方法のご紹介
正規表現関連サイトマップのご紹介
正規表現関連サイトマップをご紹介します。
正規表現関連サイトマップのご紹介 |
|||
学び/学習TOP > IT|ゲーム作り|HP作成|クラウド(エディタ|コードエディタ) | |||
IT > 開発ツールTop > 開発ツール|サクラエディタ|正規表現 | |||
正規表現Top>基礎|ツール|正規表現文(検索|置換) | |||
【基礎】 (正規表現とは|基本と活用方法|基本構文|歴史(Perl|エスケープ文字)| 特殊文字とは(メタ文字|注意点|一覧)|文字|数字|スペース|改行|行 ■エスケープ/エスケープシーケンス エスケープ/シーケンスとは|エスケープとは|エスケープシーケンスとは|エスケープ必要文字一覧表|誕生の理由 ■グループ機能(グループ化・キャプチャグループ・後方参照)) キャプチャグループ(種類||) |
|||
【ツール】 | |||
テキストエディタ|プログラム(Perl(機能と特徴l歴史)l|||)|コマンドラインツール(オススメツール|歴史)|Webブラウザ| チェックツール |
|||
【正規表現文】 | |||
■検索文 (基本|電話番号|郵便番号|メールアドレス|URL|HTMLタグ|全角文字/半角文字|かっこ内文字検索|) ■置換文 (空行を削除/追加|行頭/行末の空白を削除|行頭/行末に文字を追加| 二つの文字置換|文字を括弧で囲む|ある文字が含まれる行を削除|URLを分解|文字列の一部変更) HTML関連(HTMLタグの削除|見出し行以外の削除) サクラエディタ(改行置換|空行(改行/スペース/タブ)削除|関連ページ) |
|||
■■│コペンギンTOP > ゲーム│ホビー│書籍・マンガ│■■ |
正規表現で「HTMLコードの「見出し行」以外を削除する方法
正規表現で「HTMLコードの「見出しの行」以外を削除する方法をご紹介します。
作成したHTMLコードから見出しのみを抽出する時に便利な置換方法です。
置換したい文字
置換前
<h3>「付箋風ボックスのHTMLソースコード」のご紹介</h3>
「付箋風ボックスのHTMLソースコード」をご紹介します。
<div class="wp-block-cocoon-blocks-sticky-box blank-box block-box sticky">
<p>コンテンツの中身を入力</p>
<pre><code>
<div class="wp-block-cocoon-blocks-sticky-box blank-box block-box sticky">
<p>コンテンツの中身を入力</p>
</div>
</code></pre>
置換後
<h3>「付箋風ボックスのHTMLソースコード」のご紹介</h3>
大量に記述されている見出しも一瞬で抽出することができます。
正規表現【^(?!.*<h\d>).*$\r\n】の書き方と解説
検索文字列
^(?!.*<h\d>).*$\r\n
置換文字列
置換文字列は空です。(削除するという意味になります。)
- 「^」は行頭を表します。
- 「(?!)」は、否定先読みの意味です。「.*<h\d>」は否定先読みの条件で、この条件を満たさない行のみが、検索に引っかかることになります。
- \dは、 すべての数字[0-9]を表します。
- 「.*$」はなんでもいいから行末まで0文字以上という意味です。
- 「\r\n」は、改行を表します。
Windowsの場合は標準の改行コードがCRLFなので「\r\n」を追記しましたが、Linuxの場合は「\n」、Macの場合は「\r」を追加することで、同じ意味になります。
改行コード一覧のご紹介
|
||||
OS | 改行コード | 改行コード | 正規表現 |
サクラエディタでの表示
|
Unix | Line Feed | LF | ¥n | ↓ |
Mac(OSX) | Line Feed | LF | ¥n | ↓ |
Mac(OS9) | Carriage Return | CR | ¥r | ← |
Windows | Carriage Return+Line Feed | CR+LF | ¥r¥n | ↵ |
「基本的な正規表現一覧」のご紹介
「基本的な正規表現一覧」をご紹介します。
「基本的な正規表現一覧」のご紹介 | |||
文字 | 説明 | 正規表現の例 | マッチする例 |
. | 任意の1文字にマッチ | . | A/あ/1 |
+ | 直前の文字が1回以上繰り返す場合にマッチ最長一致 | go+gle | gogle/goooogle |
* | 直前の文字が0回以上繰り返す場合にマッチ最長一致 | go*gle | ggle/goooogle |
? | 直前の文字が0個か1個の場合にマッチ最長一致 | go?gle | ggle/gogle |
+? | 直前の文字が1回以上繰り返す場合にマッチ最短一致 | go+?gle | gogle/goooogle |
*? | 直前の文字が0回以上繰り返す場合にマッチ最短一致 | go*?gle | ggle/goooogle |
?? | 直前の文字が0個か1個の場合にマッチ最短一致 | go??gle | ggle/gogle |
| | OR条件として使われる | goog(le|ol) | google/googol |
¥ | 直後の正規表現記号をエスケープ | go¥+gle | go+gle |
[…] | 角括弧に含まれるいずれか1文字にマッチ | [abc]/[a-c] | a,b,c |
[^…] | 角括弧に含まれる文字以外にマッチ | [^abc]/[^a-c] | a,b,c以外の文字 |
(…) | 文字を1つのグループにまとめる | goog(le|ol) | google/googol |
桁数を指定す「正規表現」 | |||
文字 | 説明 | 正規表現の例 | マッチする例 |
{n} | 直前の文字の桁数を指定する | a{3} | aaa |
{n,} | 直前の文字の最小桁数のみ指定する | a{3,} | aaa/aaaaaaa |
{n,m} | 直前の文字の最小桁数と最大桁数を指定する最長一致 | a{3,4} | aaa/aaaa |
{n,m}? | 直前の文字の最小桁数と最大桁数を指定する最短一致 | a{3,4}? | aaa/aaaa |
「定義済みの正規表現」のご紹介
「定義済みの正規表現」をご紹介します。
「定義済みの正規表現」のご紹介 | ||
文字 | 説明 | 対応する表現 |
¥t | タブ | (なし) |
¥r | 改行CR(0x0D)旧マック | (なし) |
¥n | 改行LF(0x0A)Unix系OS | (なし) |
¥r¥n | Windows系OS | (なし) |
¥n¥n | 空行を追加する |
(なし) |
¥d | すべての数字 | [0-9] |
¥D | すべての数字以外の文字 | [^0-9] |
¥s | 垂直タブ以外の全ての空白文字 | [¥t¥f¥r¥n] |
¥S | すべての非空白文字 | [^¥t¥f¥r¥n] |
¥w | 英字、_、数字 | [a-zA-Z_0-9] |
¥W | 英字、_、数字以外の文字 | [^a-zA-Z_0-9] |
「特定の位置関係の正規表現」のご紹介
「特定の位置関係の正規表現」をご紹介します。
「特定の位置関係の正規表現」のご紹介 | |||
文字 | 説明 | 正規表現の例 | マッチする例 |
^ | 直後の文字が行の先頭にある場合にマッチ | google… | |
$ | 直前の文字が行の末尾にある場合にマッチ | google$ | |
¥< | 単語の先頭にマッチ | ¥< | |
¥> | 単語の末尾にマッチ | ¥> | google* |
¥b | 単語の先頭か末尾にマッチ | ¥b | *google* |
¥B | 単語の先頭か末尾以外にマッチ | ¥B | |
¥A | ファイルの先頭にマッチ | ¥A | (なし) |
¥z | ファイルの末尾にマッチ | ¥z | (なし) |
¥G | 直前の一致文字列の末尾にマッチ | ¥G | (なし) |
「置換文字列で便利に利用できる正規表現」のご紹介
「置換文字列で便利に利用できる正規表現」をご紹介します。
「置換文字列で便利に利用できる正規表現」のご紹介 | |
文字 | 説明 |
¥0 | 一致した文字列全体に置換 |
¥1~¥9 | 一致文字列の1~9番目の文字列に置換 |
¥l | 次の1文字を小文字に変換 |
¥L…¥E | 挟まれた文字列を小文字に変換 |
¥u | 次の1文字を大文字に変換 |
¥U…¥E | 挟まれた文字列を大文字に変換 |
正規表現関連サイトマップのご紹介
正規表現関連サイトマップをご紹介します。
正規表現関連サイトマップのご紹介 |
|||
学び/学習TOP > IT|ゲーム作り|HP作成|クラウド(エディタ|コードエディタ) | |||
IT > 開発ツールTop > 開発ツール|サクラエディタ|正規表現 | |||
【基礎】 (正規表現とは|基本と活用方法|基本構文|歴史(Perl|エスケープ文字)| 特殊文字とは(メタ文字|注意点|一覧)|文字|数字|スペース|改行|行 ■エスケープ/エスケープシーケンス エスケープ/シーケンスとは|エスケープとは|エスケープシーケンスとは|エスケープ必要文字一覧表|誕生の理由 ■グループ機能(グループ化・キャプチャグループ・後方参照)) キャプチャグループ(種類||) |
|||
【ツール】 | |||
テキストエディタ|プログラム(Perl(機能と特徴l歴史)l|||)|コマンドラインツール(オススメツール|歴史)|Webブラウザ| チェックツール |
|||
【正規表現文】 | |||
■検索文 (基本|電話番号|郵便番号|メールアドレス|URL|HTMLタグ|全角文字/半角文字|かっこ内文字検索|) ■置換文 (空行を削除/追加|行頭/行末の空白を削除|行頭/行末に文字を追加| 二つの文字置換|文字を括弧で囲む|ある文字が含まれる行を削除|URLを分解|文字列の一部変更) HTML関連(HTMLタグの削除|見出し行以外の削除) サクラエディタ(改行置換|空行(改行/スペース/タブ)削除|関連ページ) |
|||
■■│コペンギンTOP > ゲーム│ホビー│書籍・マンガ│■■ |
正規表現関連ページのご紹介
正規表現関連ページをご紹介します。
「正規表現の基本(特殊文字/エスケープ文字など)」のご紹介|まとめ
「正規表現の検索サンプル文集」のご紹介|まとめ
「正規表現の置換サンプル文集」のご紹介|まとめ
開発ツール関連サイトマップのご紹介
開発ツール関連サイトマップをご紹介します。
テキストエディタ関連ページのご紹介
テキストエディタ関連ページをご紹介します。
サクラエディタ関連のご紹介|まとめ
正規表現関連のご紹介|まとめ
「学ぶ」学習用関連サイトマップのご紹介
「学ぶ」学習用関連サイトマップをご紹介します。
「学ぶ」学習用関連サイトマップのご紹介 |
|||
学び/学習TOP > IT|ゲーム作り|HP作成 | |||
【IT】エディタ/正規表現|プログラミング| 【ゲーム作り】STG作り方|C言語の入門/基礎|リファレンス/サンプル文 【HP作成】WordPress|Cocoon|便利テクニック |
|||
■■│コペンギンTOP > ゲーム│ホビー│書籍・マンガ│■■ |
シューティングゲーム | ゲーム | 中古・新品通販の駿河屋
「学ぶ」学習用関連ページのご紹介
「学ぶ」学習用関連ページをご紹介
コペンギン・サイトマップ
コペンギンのサイトマップをご紹介します。
【コペンギンTOP】サイトマップ | ||||
コペンギンTOP > ゲーム│ホビー│書籍・マンガ│ | ||||
■■│コペンギンTOP > ゲーム│ホビー│書籍・マンガ│■■ |
||||
サイトマップ一覧 |
懐かしの名作から最新作までの豊富な品揃え!通販ショップの駿河屋
コペンギンサイトマップ関連ページのご紹介
コペンギン関連ページをご紹介します。