80 lines
4.7 KiB
Plaintext
80 lines
4.7 KiB
Plaintext
|
||
actress.py
|
||
完成从 list.txt 到 actress.txt 的转换。
|
||
list.txt : 从网上找到的 vixen 历年的文件列表
|
||
actress.txt : 提取出来的 女优 名字,及其出现的作品。
|
||
|
||
|
||
blacked-format.py
|
||
完成从 blacked-all.txt 到 blacked-list.txt 的转换。
|
||
blacked-all.txt : 从网上找到的 blacked 历年的文件列表
|
||
blacked-list.txt : 按照与 vixen 文件列表类似的格式输出
|
||
|
||
|
||
blacked-actress.py
|
||
完成从 blacked-list.txt 到 blacked-actress.txt 的转换。
|
||
blacked-list.txt : 从网上找到的 blacked 历年的文件列表
|
||
blacked-actress.txt : 提取出来的 女优 名字,及其出现的作品。
|
||
|
||
|
||
tushy 类似。因为 tushy 和 blacked 的下载种子中,文件列表比较乱,所以先写个脚本把它格式化掉,再处理。
|
||
|
||
|
||
|
||
tvb-actress.py
|
||
vixen, blacked, tushy 三大系列中,女优出现的情况,分为同时出现过、只在两个系列中出现过、只在一个系列中出现过。进行输出。
|
||
|
||
|
||
|
||
我们有个文件,它命名为 tushy-raw.txt ,它的格式是这样的:
|
||
|
||
Tushy.17.10.23.Blair.Williams.&.Cherie.Deville.Anal.Threesome.With.My.Boss.1080p.mp4 3.5 GB
|
||
Tushy.15.09.21.Riley.Reid.Being.Riley.Chapter.3.1080p.mp4 3.5 GB
|
||
|
||
每一行中,以空格分开的有三列,第一列里面的内容比较多,它以.为分隔,其内容为:
|
||
最前面的Tushy为固定内容,每一行都相同;
|
||
后面跟着的是日期,格式为 yy.mm.dd;
|
||
其次是演员名字,为了简化起见,我们认为每两个连续的字符串为一个演员的名字,当取完一个演员名字之后,如果后面跟着的是 &,那么再取两个连续字符串作为第二个演员的名字;如果不是 &,那么认为演员部分已经解析完成。
|
||
然后是影片的名字,它可能有多个连续的字符串,用.拼接起来;影片名的最后两段,固定为 分辨率.格式
|
||
第一列中的内容如上。
|
||
第二列和第三列,共同构成了文件大小,分别是影片大小,单位。
|
||
|
||
以上为文件的规则描述,但有几个特例,需要进行额外的处理:
|
||
1,如果当前处理的行中,有 Alex.H.Banks Jenna.J.Ross Anna.De.Ville Kylie.Le.Beau 出现,那么演员的名字是三个字符串,而不是上面说的两个;
|
||
2,如果当前处理的行中,有 Sybil ,那么演员的名字是一个字符串,而不是上面说的两个;
|
||
3,对 Tushy.18.07.15.Sybil.Oil.&.Anal.1080p.mp4 这一行,我们需要先把其中的 & 替换成 and,然后再处理。
|
||
|
||
|
||
描述完文件格式,我们说一下需求。希望能产生一个结果文件,命名为 tushy-list.txt,它的每行格式为:
|
||
20xx.mm.dd 演员(, 演员2) - 影片名.分辨率.格式 影片大小 单位
|
||
请注意,如果影片名为空的话,我们把它统一写成 xxxx
|
||
|
||
好了,请你理解上述需求,并编写相应的python代码实现。
|
||
|
||
|
||
|
||
|
||
我们有个文件,它命名为 blacked-all.txt ,它的格式是这样的:
|
||
|
||
Tushy.17.10.23.Blair.Williams.&.Cherie.Deville.Anal.Threesome.With.My.Boss.1080p.mp4 3.5 GB
|
||
Tushy.15.09.21.Riley.Reid.Being.Riley.Chapter.3.1080p.mp4 3.5 GB
|
||
|
||
每一行中,以空格分开的有三列,第一列里面的内容比较多,它以.为分隔,其内容为:
|
||
最前面的Tushy为固定内容,每一行都相同;
|
||
后面跟着的是日期,格式为 yy.mm.dd;
|
||
其次是演员名字,为了简化起见,我们认为每两个连续的字符串为一个演员的名字,当取完一个演员名字之后,如果后面跟着的是 &,那么再取两个连续字符串作为第二个演员的名字;如果不是 &,那么认为演员部分已经解析完成。
|
||
然后是影片的名字,它可能有多个连续的字符串,用.拼接起来;影片名的最后两段,固定为 分辨率.格式
|
||
第一列中的内容如上。
|
||
第二列和第三列,共同构成了文件大小,分别是影片大小,单位。
|
||
|
||
以上为文件的规则描述,但有几个特例,需要进行额外的处理:
|
||
1,如果当前处理的行中,有 Alex.H.Banks Jenna.J.Ross Anna.De.Ville Kylie.Le.Beau 出现,那么演员的名字是三个字符串,而不是上面说的两个;
|
||
2,如果当前处理的行中,有 Sybil ,那么演员的名字是一个字符串,而不是上面说的两个;
|
||
3,对 Tushy.18.07.15.Sybil.Oil.&.Anal.1080p.mp4 这一行,我们需要先把其中的 & 替换成 and,然后再处理。
|
||
|
||
|
||
描述完文件格式,我们说一下需求。希望能产生一个结果文件,命名为 tushy-list.txt,它的每行格式为:
|
||
20xx.mm.dd 演员(, 演员2) - 影片名.分辨率.格式 影片大小 单位
|
||
请注意,如果影片名为空的话,我们把它统一写成 xxxx
|
||
|
||
好了,请你理解上述需求,并编写相应的python代码实现。 |