modify scripts

2025-07-18 21:03:12 +08:00
parent 031596769e
commit 3a7bd045d0
2 changed files with 50 additions and 0 deletions
--- a/scrapy_proj/scrapy_proj/db_wapper/spider_db_handler.py
+++ b/scrapy_proj/scrapy_proj/db_wapper/spider_db_handler.py
@ -117,6 +117,7 @@ class IAFDDBHandler(SQLiteDBHandler):
        self.tbl_name_performers = 'iafd_performers'
        self.tbl_name_movies = 'iafd_movies'
        self.uniq_key = 'href'
        self.tbl_name_thelordofporn_actress = 'thelordofporn_actress'
    def insert_item(self, item):
        pass
@ -213,6 +214,42 @@ class IAFDDBHandler(SQLiteDBHandler):
            return None
    # 按条件查询 href 列表 
    def get_lord_actors(self, **filters):
        try:
            sql = f"SELECT href, pornstar as name, id FROM {self.tbl_name_thelordofporn_actress} WHERE 1=1"
            params = []
            conditions = {
                "id": " AND id = ?",
                "href": " AND href = ?",
                "pornstar": " AND pornstar LIKE ?",
                "start_id": " AND id > ?",
            }
            for key, condition in conditions.items():
                if key in filters:
                    sql += condition
                    if key == "pornstar":
                        params.append(f"%{filters[key]}%")
                    else:
                        params.append(filters[key])
            if "order_by" in filters:
                # 注意：这里 order by 后面直接跟字段名，不能用占位符，否则会被当作字符串处理
                sql += f" ORDER BY {filters['order_by']} "
            if 'limit' in filters:
                sql += " LIMIT ?"
                params.append(filters["limit"])
            self.cursor.execute(sql, params)
            return [dict(row) for row in self.cursor.fetchall()]
        except sqlite3.Error as e:
            logging.error(f"查询 href 失败: {e}")
            return None
@register_handler(comm.SPIDER_NAME_PBOX)
 class PboxDBHandler(SQLiteDBHandler):
    def __init__(self, db_path=shared_db_path):
--- a/scrapy_proj/scrapy_proj/spiders/clm_spider.py
+++ b/scrapy_proj/scrapy_proj/spiders/clm_spider.py
@ -5,6 +5,9 @@ from scrapy_proj.utils.utils import parse_size, parse_date_to_datetime
 from scrapy_proj.spiders.base_spider import BaseSpider, extract_text_from_element
 from scrapy_proj.items import ClmIndexItem, ClmKeyWordsItem
 from scrapy_proj.comm.comm_def import SPIDER_NAME_CLM, ITEM_TYPE_CLM_INDEX, ITEM_TYPE_CLM_KEYWORDS
 from scrapy_proj.db_wapper.spider_db_handler import IAFDDBHandler
 db_tools = IAFDDBHandler()
 default_keywords = [
    'vixen', 'tushy', 'tushyraw', 'blacked', 'blackedraw', 'deeper',  # vixen group
@ -56,6 +59,16 @@ class ClmSpider(BaseSpider):
        item['words'] = self.keywords if self.keywords else 'default keywords'
        yield item
        if self.debug:
            actors = db_tools.get_lord_actors(limit = 5)
        else:
            actors = db_tools.get_lord_actors()
        if actors:
            for row in actors:
                list_words.append(row['name'])
        else:
            self.logger.warning(f"get_lord_actors error.")
        for item in list_words:
            encoded_keyword = quote_plus(item.strip())