mirror of
https://github.com/jxxghp/MoviePilot.git
synced 2026-04-14 10:10:20 +08:00
当文件名(stem)为纯中文压制/字幕辅助标签(如"简英双语特效")且父目录包含 拉丁片名时,清空文件元数据的标题信息,改由父目录标题合并填充,避免识别失败。 新增 infopath 模块集中管理辅助标签判断逻辑与关键词正则。
42 lines
1.5 KiB
Python
42 lines
1.5 KiB
Python
import regex as re
|
|
|
|
from app.core.meta.metabase import MetaBase
|
|
from app.utils.string import StringUtils
|
|
|
|
AUXILIARY_CN_STEM_FULLMATCH_RE = re.compile(
|
|
r"^(双语|字幕|特效|内封|外挂|官译|简体|繁体|繁中|简中|中英|简英|多语|"
|
|
r"国英|台粤|音轨|评论|国配|台配|粤语|韩语|日语|杜比|全景声|无损|中字|"
|
|
r"国语|原声)+$"
|
|
)
|
|
|
|
|
|
def should_use_parent_title_for_file_stem(
|
|
stem: str, parent_dir_name: str, file_meta: MetaBase
|
|
) -> bool:
|
|
"""
|
|
文件名(无后缀)是否仅为简繁体/字幕/特效等辅助说明,应改用父目录标题识别。
|
|
要求:
|
|
- stem 纯中文且能被辅助关键词完全覆盖(无残留有意义汉字)
|
|
- 父目录含拉丁字母,避免纯中文资源目录误把正片中文名当标签清空
|
|
"""
|
|
if not file_meta.isfile or not stem or not parent_dir_name:
|
|
return False
|
|
if file_meta.tmdbid or file_meta.doubanid:
|
|
return False
|
|
if not re.search(r"[A-Za-z]{2,}", parent_dir_name):
|
|
return False
|
|
if not StringUtils.is_all_chinese(stem):
|
|
return False
|
|
if len(stem) > 16:
|
|
return False
|
|
if not AUXILIARY_CN_STEM_FULLMATCH_RE.match(stem):
|
|
return False
|
|
if re.search(r"[第共]\s*[0-9一二三四五六七八九十百零]+\s*[季集话話]", stem):
|
|
return False
|
|
return True
|
|
|
|
|
|
def clear_parsed_title_for_parent_merge(meta: MetaBase) -> None:
|
|
meta.cn_name = None
|
|
meta.en_name = None
|