more regexes, shorten regex flags

This commit is contained in:
xenofem 2024-02-22 19:24:01 -05:00
parent 15410ca8ba
commit 3ed462972a

View file

@ -27,22 +27,30 @@ DLSITE_ID_REGEX = re.compile('^[BR]J[0-9]+$')
FANZA_ID_REGEX = re.compile('^d_[0-9]+$') FANZA_ID_REGEX = re.compile('^d_[0-9]+$')
FAKKU_ID_REGEX = re.compile('.*_FAKKU$') FAKKU_ID_REGEX = re.compile('.*_FAKKU$')
HI_RES_REGEX = re.compile('高解像度', re.IGNORECASE) HI_RES_REGEX = re.compile('高解像度', re.I)
NO_TONE_REGEX = re.compile('トーン(効果)?[な無]し|グレースケール', re.IGNORECASE) NO_TONE_REGEX = re.compile('トーン(効果)?[な無]し|グレースケール', re.I)
TONE_REGEX = re.compile('トーン(版|(効果)?[有あ]り)', re.IGNORECASE) TONE_REGEX = re.compile('トーン(版|(効果)?[有あ]り)', re.I)
COLOR_REGEX = re.compile('カラー', re.IGNORECASE) COLOR_REGEX = re.compile('カラー', re.I)
MONOCHROME_REGEX = re.compile('モノクロ', re.IGNORECASE) MONOCHROME_REGEX = re.compile('モノクロ', re.I)
IMAGE_QUALITY_REGEXES = [ IMAGE_QUALITY_REGEXES = [
{ 'better': HI_RES_REGEX }, { 'better': HI_RES_REGEX },
{ 'better': NO_TONE_REGEX, 'worse': TONE_REGEX }, { 'better': NO_TONE_REGEX, 'worse': TONE_REGEX },
{ 'better': COLOR_REGEX, 'worse': MONOCHROME_REGEX }, { 'better': COLOR_REGEX, 'worse': MONOCHROME_REGEX },
] ]
TEXTLESS_REGEX = re.compile('(台詞|セリフ|せりふ|テキスト|文字)((な|無)し|抜き)|notext|textless', re.IGNORECASE) LANGUAGE_REGEXES = {
FRONT_COVER_REGEX = re.compile('(^|[^裏])表紙|cover|hyoushi', re.IGNORECASE) 'en_US': re.compile('english|英語', re.I),
BACK_COVER_REGEX = re.compile('裏表紙', re.IGNORECASE) 'ja_JP': re.compile('日本語', re.I),
BONUS_REGEX = re.compile('設定|キャラ', re.IGNORECASE) 'zh_CN': re.compile('(^|[^體])中文|中国語', re.I),
EPILOGUE_REGEX = re.compile('after|後日談|おまけ', re.IGNORECASE) 'zh_TW': re.compile('繁體中文', re.I),
'ko_KR': re.compile('한국어', re.I),
}
TEXTLESS_REGEX = re.compile('(台詞|セリフ|せりふ|テキスト|文字)((な|無)し|抜き)|notext|textless', re.I)
FRONT_COVER_REGEX = re.compile('(^|[^裏])表紙|cover|hyoushi', re.I)
BACK_COVER_REGEX = re.compile('裏表紙', re.I)
BONUS_REGEX = re.compile('設定|キャラ|特典|ポスター', re.I)
EPILOGUE_REGEX = re.compile('after|後日談|おまけ', re.I)
SPLITS = [ SPLITS = [
{ 'later': TEXTLESS_REGEX }, { 'later': TEXTLESS_REGEX },
{ 'earlier': FRONT_COVER_REGEX, 'later': BACK_COVER_REGEX }, { 'earlier': FRONT_COVER_REGEX, 'later': BACK_COVER_REGEX },