import re



s = 'this is *sample string* for _extracting substring_.'



# アスタリスクで囲まれている部分を抽出

p = r'\*.*\*' # アスタリスクに囲まれている任意の文字

#p = r'\*[^*]*\*' # アスタリスクに囲まれているアスタリスク以外の文字

r = re.findall(p, s) # パターンに当てはまるものを全て抽出

print(r) # ['*sample string*']



# アスタリスクが不要ならグループを使って抽出する部分を指定する

p = r'\*(.*)\*' # アスタリスクに囲まれている任意の文字(アスタリスクを除く)

r = re.findall(p, s)

print(r) # ['sample string']



# 貪欲マッチと非貪欲マッチ(最小マッチ)

s = 'this is *sample string* for *extracting substring*'

p = r'\*(.*)\*' # 貪欲マッチ(上と同じ)

r = re.findall(p, s)

print(r) # ['sample string* for *extracting substring']



p = r'\*(.*?)\*' # 非貪欲マッチ(最小マッチ)

r = re.findall(p, s)

print(r) # ['sample string', 'extracting substring']



p = r'\*([^*]*)\*' # アスタリスクに囲まれたアスタリスク以外の文字(貪欲マッチ)

r = re.findall(p, s)

print(r) # ['sample string', 'extracting substring']



# アスタリスクかアンダースコアで囲まれている部分を抽出

s = 'this is *sample string* for _extracting substring_.'

p = r'\*(.*?)\*|_(.*?)_' # バーティカルバー「|」で2つの条件を列記

r = re.findall(p, s)

print(r) # [('sample string', ''), ('', 'extracting substring')]



r = [item[0] + item[1] for item in re.findall(p, s)]

# r = [item[0] if item[0] else item[1] for item in re.findall(p, s)]

print(r) # ['sample string', 'extracting substring']



p = r'[*_](.*?)[*_]' # 大かっこ「[]」にアスタリスクとアンダースコアを指定

r = re.findall(p, s)

print(r) # ['sample string', 'extracting substring']



# Markdown記法のリンクからテキストとURLを抽出する

s = '[Deep Insider](https://www.atmarkit.co.jp/ait/subtop/di/)は' + \

'[@IT](https://www.atmarkit.co.jp/ "@IT")のフォーラムの一つです。'



p = '\\[(.*?)\\]\\((.*?)\\s*(?:"(.*?)")?\\)'

r = re.findall(p, s)

print(r)

# 出力結果

# [('Deep Insider', 'https://www.atmarkit.co.jp/ait/subtop/di/', ''), ('@IT',

# 'https://www.atmarkit.co.jp/', '@IT')]