more regex

This commit is contained in:
xenofem 2024-05-04 17:33:20 -04:00
parent 086a8112e6
commit 0b159ebba7

View file

@ -38,7 +38,7 @@ DLSITE_ID_REGEX = re.compile('^[BR]J[0-9]+$')
FANZA_ID_REGEX = re.compile('^d_[0-9]+$') FANZA_ID_REGEX = re.compile('^d_[0-9]+$')
FAKKU_ID_REGEX = re.compile('.*_FAKKU$') FAKKU_ID_REGEX = re.compile('.*_FAKKU$')
HI_RES_REGEX = re.compile('高解像度|原寸|大サイズ', re.I) HI_RES_REGEX = re.compile('高解像度|原寸|実寸|大サイズ', re.I)
NO_TONE_REGEX = re.compile('トーン(効果)?[な無]し|グレー?スケ', re.I) NO_TONE_REGEX = re.compile('トーン(効果)?[な無]し|グレー?スケ', re.I)
TONE_REGEX = re.compile('トーン($|版|(効果)?[有あ]り)', re.I) TONE_REGEX = re.compile('トーン($|版|(効果)?[有あ]り)', re.I)
COLOR_REGEX = re.compile('カラー', re.I) COLOR_REGEX = re.compile('カラー', re.I)
@ -47,6 +47,7 @@ MOSAIC_REGEX = re.compile('モザイク', re.I)
BLACKBAR_REGEX = re.compile('墨消し', re.I) BLACKBAR_REGEX = re.compile('墨消し', re.I)
IMAGE_QUALITY_REGEXES = [ IMAGE_QUALITY_REGEXES = [
{ 'better': HI_RES_REGEX }, { 'better': HI_RES_REGEX },
{ 'better': re.compile('^大|L|$'), 'worse': re.compile('^小|S|$') },
{ 'better': NO_TONE_REGEX, 'worse': TONE_REGEX }, { 'better': NO_TONE_REGEX, 'worse': TONE_REGEX },
{ 'better': COLOR_REGEX, 'worse': MONOCHROME_REGEX }, { 'better': COLOR_REGEX, 'worse': MONOCHROME_REGEX },
{ 'better': BLACKBAR_REGEX, 'worse': MOSAIC_REGEX }, { 'better': BLACKBAR_REGEX, 'worse': MOSAIC_REGEX },
@ -66,7 +67,7 @@ FXLESS_REGEX = re.compile('効果音(な|無)し', re.I)
FRONT_COVER_REGEX = re.compile('(?<!裏)表紙(?!裏)|(?<!back[-_ ])(?<!back)cover|(?<!ura[-_ ])(?<!ura)hyou?sh?i(?![-_ ]?ura)', re.I) FRONT_COVER_REGEX = re.compile('(?<!裏)表紙(?!裏)|(?<!back[-_ ])(?<!back)cover|(?<!ura[-_ ])(?<!ura)hyou?sh?i(?![-_ ]?ura)', re.I)
BACK_COVER_REGEX = re.compile('裏表紙|hyou?sh?i[-_ ]?ura|ura[-_ ]?hyou?sh?i', re.I) BACK_COVER_REGEX = re.compile('裏表紙|hyou?sh?i[-_ ]?ura|ura[-_ ]?hyou?sh?i', re.I)
BONUS_REGEX = re.compile('設定|キャラ|特典|ポスター|bonus', re.I) BONUS_REGEX = re.compile('設定|キャラ|特典|ポスター|bonus', re.I)
EPILOGUE_REGEX = re.compile('after|後日談|おまけ|omake', re.I) EPILOGUE_REGEX = re.compile('after|後日談|おまけ|omake|オマケ', re.I)
AFTERWORD_REGEX = re.compile('あとがき', re.I) AFTERWORD_REGEX = re.compile('あとがき', re.I)
SPLITS = [ SPLITS = [
{ 'later': TEXTLESS_REGEX }, { 'later': TEXTLESS_REGEX },