Files
stock/scripts/history/prompt.txt
2024-10-03 11:13:19 +08:00

80 lines
4.7 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

actress.py
完成从 list.txt 到 actress.txt 的转换。
list.txt : 从网上找到的 vixen 历年的文件列表
actress.txt : 提取出来的 女优 名字,及其出现的作品。
blacked-format.py
完成从 blacked-all.txt 到 blacked-list.txt 的转换。
blacked-all.txt : 从网上找到的 blacked 历年的文件列表
blacked-list.txt : 按照与 vixen 文件列表类似的格式输出
blacked-actress.py
完成从 blacked-list.txt 到 blacked-actress.txt 的转换。
blacked-list.txt : 从网上找到的 blacked 历年的文件列表
blacked-actress.txt : 提取出来的 女优 名字,及其出现的作品。
tushy 类似。因为 tushy 和 blacked 的下载种子中,文件列表比较乱,所以先写个脚本把它格式化掉,再处理。
tvb-actress.py
vixen, blacked, tushy 三大系列中,女优出现的情况,分为同时出现过、只在两个系列中出现过、只在一个系列中出现过。进行输出。
我们有个文件,它命名为 tushy-raw.txt ,它的格式是这样的:
Tushy.17.10.23.Blair.Williams.&.Cherie.Deville.Anal.Threesome.With.My.Boss.1080p.mp4 3.5 GB
Tushy.15.09.21.Riley.Reid.Being.Riley.Chapter.3.1080p.mp4 3.5 GB
每一行中,以空格分开的有三列,第一列里面的内容比较多,它以.为分隔,其内容为:
最前面的Tushy为固定内容每一行都相同
后面跟着的是日期,格式为 yy.mm.dd
其次是演员名字,为了简化起见,我们认为每两个连续的字符串为一个演员的名字,当取完一个演员名字之后,如果后面跟着的是 &,那么再取两个连续字符串作为第二个演员的名字;如果不是 &,那么认为演员部分已经解析完成。
然后是影片的名字,它可能有多个连续的字符串,用.拼接起来;影片名的最后两段,固定为 分辨率.格式
第一列中的内容如上。
第二列和第三列,共同构成了文件大小,分别是影片大小,单位。
以上为文件的规则描述,但有几个特例,需要进行额外的处理:
1如果当前处理的行中有 Alex.H.Banks Jenna.J.Ross Anna.De.Ville Kylie.Le.Beau 出现,那么演员的名字是三个字符串,而不是上面说的两个;
2如果当前处理的行中有 Sybil ,那么演员的名字是一个字符串,而不是上面说的两个;
3对 Tushy.18.07.15.Sybil.Oil.&.Anal.1080p.mp4 这一行,我们需要先把其中的 & 替换成 and然后再处理。
描述完文件格式,我们说一下需求。希望能产生一个结果文件,命名为 tushy-list.txt它的每行格式为
20xx.mm.dd 演员(, 演员2) - 影片名.分辨率.格式 影片大小 单位
请注意,如果影片名为空的话,我们把它统一写成 xxxx
好了请你理解上述需求并编写相应的python代码实现。
我们有个文件,它命名为 blacked-all.txt ,它的格式是这样的:
Tushy.17.10.23.Blair.Williams.&.Cherie.Deville.Anal.Threesome.With.My.Boss.1080p.mp4 3.5 GB
Tushy.15.09.21.Riley.Reid.Being.Riley.Chapter.3.1080p.mp4 3.5 GB
每一行中,以空格分开的有三列,第一列里面的内容比较多,它以.为分隔,其内容为:
最前面的Tushy为固定内容每一行都相同
后面跟着的是日期,格式为 yy.mm.dd
其次是演员名字,为了简化起见,我们认为每两个连续的字符串为一个演员的名字,当取完一个演员名字之后,如果后面跟着的是 &,那么再取两个连续字符串作为第二个演员的名字;如果不是 &,那么认为演员部分已经解析完成。
然后是影片的名字,它可能有多个连续的字符串,用.拼接起来;影片名的最后两段,固定为 分辨率.格式
第一列中的内容如上。
第二列和第三列,共同构成了文件大小,分别是影片大小,单位。
以上为文件的规则描述,但有几个特例,需要进行额外的处理:
1如果当前处理的行中有 Alex.H.Banks Jenna.J.Ross Anna.De.Ville Kylie.Le.Beau 出现,那么演员的名字是三个字符串,而不是上面说的两个;
2如果当前处理的行中有 Sybil ,那么演员的名字是一个字符串,而不是上面说的两个;
3对 Tushy.18.07.15.Sybil.Oil.&.Anal.1080p.mp4 这一行,我们需要先把其中的 & 替换成 and然后再处理。
描述完文件格式,我们说一下需求。希望能产生一个结果文件,命名为 tushy-list.txt它的每行格式为
20xx.mm.dd 演员(, 演员2) - 影片名.分辨率.格式 影片大小 单位
请注意,如果影片名为空的话,我们把它统一写成 xxxx
好了请你理解上述需求并编写相应的python代码实现。