69919.jpg

kknd2

GF  2019-10-14 10:50
(怎么改ID捏)

大家在整理本子时候,是如何在巨量的文件中挑出重复本子呢?

比如同一个本子的汉化可能是好几个不同个人或者汉化组 其实收一个版本就可以了
但是在超级多的文件中,去把相同本子翻出来 简直是难事

我的办法是

1 先使用coversucker把同一个大文件夹下的本子封面都提取出来 (比如文件夹 2019汉化本),输出这些封面到一个目录,比如
目录:2019汉化本封面,coversucker会以本子的原始文件名给封面图片命名
2 用alike软件在目录2019汉化本封面寻找相似图片,就可以定位出那些本子和那些本子之间是相似度过高

3 将相似图片,放在一起,比如放在:重复 这个文件夹

4使用everything开始将相似图片文件名进行搜索,然后就可以找到本子的位置,并且决定是否要删除

可是我总觉得这项工作太繁琐,很磨人,结果越来越懒,本子重复的也多了起来,硬盘变得十分臃肿

请问大家是如何整理重复本子的呢?

nami8.jpg

绅士老司机

B1F  2019-10-14 11:01
(丰乳肥臀爱好者)
基本都是按画师分文件夹,平时下载就堆在一起。 老实说很多本子我都没看完,AV也是一样。你要知道,出的速度比你看的速度快多了。一直整理也不是办法,耗时耗力,反正也是拿来施法的,随机一本还有新鲜感。

QQ20170204020847.gif

Kuro

B2F  2019-10-14 11:16
(度娘账号又双叒叕被封了 QAQ)
自己写个python程序,把每个文件夹名字里的"[xxx汉化组]"移到名字最后,再按照名称排列,这样名字相同的文件夹都排在一起了,一眼就看出来了

大概就是这样
复制代码
  1. def move():
  2.     abs_path = os.getcwd() + "\\"
  3.     for i in next(os.walk('.'))[1]:
  4.         ind = i.find(']')
  5.         if ind != -1:
  6.             if "汉化" in i[0:ind+1] or "漢化" in i[0:ind+1]:
  7.                 os.renames(abs_path + i, abs_path + i[ind+1:] + " " + i[0:ind+1])
  8.     remove_parenthesis()
  9. def remove_parenthesis():
  10.     abs_path = os.getcwd() + "\\"
  11.     for i in next(os.walk('.'))[1]:
  12.         ind = i.find('[')
  13.         if ind != -1:
  14.             if "(" in i[0:ind]:
  15.                 try:
  16.                     os.renames(abs_path + i, abs_path + i[ind:])
  17.                 except:
  18.                     print(abs_path + i[ind:] + " 已经存在!")

889485.png

我叫拉法姆

B3F  2019-10-14 11:16
(拉法姆才是____)
我用的calibre  下载完导入的时候就已经根据文件命名规则提取出本子名了,所以根本不需要去重

504693.jpg

絵理酱

最笨的方法,新建个文件夹,然后CTRL选目标然后丢进垃圾桶

1057445.jpg

天与海之雾

B5F  2019-10-14 12:00
(大梦不醒,谁人知?)
我按标签分类,我的本子分母系,姐系,还有FGO,和人外娘之类的。然后每个本子单独一个文件夹。每个文件夹名称格式是[画师名][本子名(中文译名)],不存在重复。

1123383.png

dreamhack

B6F  2019-10-14 12:07
(头像 谷歌搜 loli_miu webcam)
有没有可以显示封面的方法啊,跟H站一样,我是绅士漫画下载的,虽然很方便,但是名字全是乱码,能直接看封面吗

a7.gif

怀奕2604

下载好后定期分类

729235.jpg

the司徒

没认真整理过

765323.jpg

ilIilIliIl

...

none.gif

留邮箱

看完就删掉,反正基本不会看第二遍,最社保的永远是下一本

none.gif

炎阳

按照画师分类文件夹,同样的本子瞬间就找到了

4.gif

64f09f6a

我目前只搜集中文版 一段时间后看看画家有没有出新作 总之整理起来也比较繁琐 不过还是很有乐趣
就像女优一样 老朋友出新作和突然发现对胃的新朋友都是非常让人欣喜的
但随着阅历和年龄的增大 老朋友走的也多 新朋友入眼的也少
总之 且行且珍惜吧

none.gif

ad88cdc9

我是按画师名字分

none.gif

Nico_Ezawa

马克下
自己也有类似的技术需求

346811.jpg

谙邪

B15F  2019-10-14 15:27
(í eilíflegum hring)

回 2楼(Kuro) 的帖子

大佬这硬核分类属实惊到我了
南+大神

lCEo9LQjSKvt6bc.gif

南♂魂

B16F  2019-10-14 15:28
(ex公号https://south-plus.net/read.php?tid=465559)
不挑了 反正也不大

1036742.png

SynapsePHAOS

B17F  2019-10-14 15:32
(_(:3」∠)_)
都堆在一起,不会有太多重复的,反正百分之个位数懒得管了

819252.jpg

腐朽蠹宠

按照画师分类挺不错的。