539764.jpg

51183eec

GF  2019-10-12 15:31

【总结帖】【多图】 收集各种tag以及知识 (持续更新)

之前我介绍过了Sankaku的图站搜索
https://level-plus.net/read.php?tid-640120.html

但是S站也有不少缺点,这里说一下
1. 标签太多而且太复杂了,不够规范化
这一点不好的原因是没有和EXH统一,导致tag会以很多其他的方式表现,EXH里有一个标签叫facesitting,也就是顔面騎乗
但是你在S站会发现这个只有10个,为什么?因为真正的标签叫sitting_on_face
诸如此类的例子还有很多,总之一句话:S站的标签实在是太多了,没有办法标准统一化

如果有着EXH那样严格的逻辑才比较好,比如github上有这样一个标签翻译项目,是关于EXH所有标签的含义的
https://github.com/EhTagTranslation/Database/tree/master/database

然后你会看见比如
harem    后宫    被至少三人追捧,自愿发生性关系且所有人参与。需要乱交(group)标签。不用于强奸(rape)的情况。

如果S站在图片的标签分类能有类似的条件关系的话,我想搜索应该会更轻松一些,可惜的就是EXH这方面都做得不够好(不是每个人都会及时的给一个新作品打上标签),而S站标签一多就更乱了

2. 图很多但是很杂
也就是不够专一,EXH可以说在漫画/同人志和CG方面很丰富了(CG可能略逊色与hitomi),但是S站就是各种资源的图都有,所以你就相当于在未知区域的海没目的的捞东西,也不知道能不能捞到你想要的东西,因为可能这类资源就从来不存在过

3. 广告+非分页式载入,不方便标记
比如EXH你可以快速跳到第九页,但是S站只能从头放下滚,就很烦

不过正是因为S站标签多所以你可以干一些EXH做不到的事,之前我发过一个主题
https://level-plus.net/read.php?tid-612461.html

正是因为EXH找不到对应的标签,后来我在S站找到了对应的leg_up(片足上げ)
所以此贴就作为各种Tag对应意义及其更新,也算作是小发现了

不过本帖内容包含但不限于此,很多内容pixiv里面更详细,所以有大佬有什么新奇发现,都可以分享到这里来
众人拾柴火焰高

539764.jpg

51183eec

B1F  2019-10-12 15:32
https://level-plus.net/read.php?tid-612461-fpage-0-toread--page-3.html
之前我发的帖子的第三页,有人说喜欢这种姿势,但是其实你并没有办法在EXH找到对应标签
我一开始也试过了后来失败了

然后有一次看Pixiv的时候发现有类似的图,里面有个叫種付けプレス的标签
于是我在s站找到了对应的英文,叫mating_press
下面是其在urban dictionary的解释
https://www.urbandictionary.com/define.php?term=mating%20press

所以这个老哥应该喜欢的是mating_press/piledriver姿势
而又有一个标签是通用的就是leg_lock,顾名思义,双腿把人'锁住',这个配合mating_press既可以看到类似如下的内容


然后piledrive的,注意看区别


所以其实就是个特别的体位,google翻译日文出来是播种机,就当是播种机好了,往里面注入种子

然后leg_up其实就很复杂了,类似的标签有很多,所以有的时候不是那么好搜,标签之间的界定也只有微笑的区别

leg_up本身只要一条腿微微抬起来就可以算
比如这样

但实际上我要的是这样

什么,你说还能两条腿抬起来?是的,那个叫legs_up


leg_up这个模糊的定位导致你可能得不到你想要的图,所以通常还有类似的强条件和弱条件以及不知道具体区别的条件  
standing_on_one_leg 单腿站着,用于防止是躺着的
one_leg_raised 单脚抬起
leg_lift 抬腿

这些都可以尝试,其实我说不出来准确的区别,而且他们图分类也没那么严格(这就是我说的区别),可能有的你想要的图被界定为one_leg_raised  
而你觉得是leg_lift,所以都尝试一下就好了

有的人喜欢看抬腿展示,而不喜欢看抬腿XXOO,那可以加入exhibitionism
  

539764.jpg

51183eec

B2F  2019-10-12 23:42

回 3楼(b37808dc) 的帖子

就是个图

539764.jpg

51183eec

B3F  2019-10-14 03:29
播种机体位的画师/本子


[ちんちん亭 (chin)]
这兄弟专业播种机好吧,基本上本子都是这种体位作为核心的

东方的播种体位合集,基本上看过这个很多TAG就全了
(例大祭12) [くまたんFlash! (よろず)] 幻想郷に種付けおじさんがやってきたYA-YA-YA (東方Project)

539764.jpg

51183eec

B4F  2019-10-24 11:45
好久没更新了,对之前的一些问题做一些回复
B11F  2019-10-14 11:23
其实我一直想知道hardcore是什么意思,硬核要怎么理解

根据我给的github链接,你可以在数据库里面看到misc.md文件里写到
hardcore    硬核    明确描述性行为,如插入阴道或肛交(anal)。口交(blowjob)或性玩具(sex toys)不算在内。仅用于 Cosplay 画廊
所以对于本子来说不是很重要好吧

B15F  2019-10-14 15:36
所以说楼主8楼第一张图的本子没写名字啊

兄弟我都给了作者了啊,这不自己试着搜一下,太伸手了吧
(C94) [ちんちん亭 (chin)] スキマ妖怪と本気子作り


B22F  2019-10-14 21:17
问一下楼主S站怎么查多个标签,一般不是只能差一个吗?多数的标签应该怎么查

好吧,我以为你们都懂搜索标签的基本操作,那么我还是自己讲一下好了

主要就讲解三个网站,EXH,S站以及NH(https://nhentai.net/)的原理
首先,通过标签搜索可以有几种方式,一个是点击标签直接就会跳转到以该标签搜索的页面(EXH需要点击标签在底下选择 Show Tagged Galleries)
这种比较简单无脑,也是单标签搜索

还有一种就是多标签/文字匹配搜索,需要在搜索栏里面输入文字,这个是支持多标签的,只要你的两个标签关键字之间有空格隔开就会默认取两个标签的交集
比如下面所示的在三个不同的网站输入如下文字
EHX: character:"minami nitta$" group
NH: character:minami nitta group
S站: nitta_minami group

这是搜索新田美波+群P标签,有人想问了为什么这么复杂?EXH/NH你也可以就输入minami nitta group结果也大致会是一样的,在你不想动脑子的时候可以就这样搜索就足够了
这就是多标签搜索的方式
=======================================================分割线

进阶版
其实之所以要写的这么复杂是因为匹配机制,比如你写minami nitta group搜索引擎会自动寻找所有标签里有minami+有nitta+有group的作品
但是如果你写character:"minami nitta$" group 只会找标签=minami nitta+标签=group的作品
看到区别了吗,如果还是不懂,你可以通过结果数量来发现区别
NH里面:minami nitta group = 115 Results
character:minami nitta group = 112 Results
为什么少了,因为有一些作品被踢掉了,什么作品呢
https://nhentai.net/g/174716/
看一下这个作品的标签: group (65,118)  minami haruka (35) nitta youka (18)
现在懂了吧,锁定角色标签可以让你的结果更准确,去除一些不必要的结果

另外说一下NH和EH的匹配机制不同,NH在字符比较少的时候不符合完美匹配机制即使没有空格,举个例子,你写ABC,大家心里面都觉得找到的结果应该是
标题:xxxxxABCxxxx 或者标签: ABC
但是NH不是,NH会认为这样的标题也符合要求:xxxAxxxBxxxxC

举个最简单的例子的话,你搜索'社保’会出来这么个结果
(C57) [変質社、あとりえKINTA (神保ひとで、姫ノ神金太)] きょうの一発目! (トゥハート)

看见了吗,根本没有社保在一起的字段
好消息的是,EXH是严格匹配的,不允许字符交换位置或者分别出现

下面用数学(口胡)的角度来分析一下标签搜索
标签1     标签2    标签3  = 搜索标签1+标签2+标签3的交集(中间空格的长度不影响逻辑)
这也就是所谓的多标签

有人会问了,那么差集怎么办,何为差集,即作品属于标签1但不属于标签2
如果要举个例子,gustav老师的新田美波一直特别赞,但是你今天看腻了,不想看他的任何作品了(过分了,看一次射一次好吗),怎么办?
无论是EXH,NH还是S站都支持这个功能,在标签前加上'-'即可,也就是键盘上=旁边的那个
举个例子,NH
character:minami nitta = 356 Results
character:minami nitta -gustav = 319 Results

gustav的好作品就这样被你无情的踢掉了,这个方法适用于任何标签,比如有人很讨厌看见本子里出现触手,那就搜索时空出来多加一个 -tentacles 就可以筛掉这些‘万恶’的本子了

那么好奇的群众又要问了,并集怎么办?我全都要
额...不好意思,没有办法,但是大家都是筛选选好的精美的射爆的那种,你全都要不说质量,看得过来吗

黑名单
这个其实很容易理解吧,你不想每次搜索都踢掉你讨厌的东西,干脆直接让其在搜索时就被自动踢掉了,注意的是EXH会直接踢掉结果,并且提示你
Showing 34 results. Your filters excluded 1 gallery from this page
而NH会显示所有作品但是含有黑名单标签的作品会有变暗+模糊处理,你还是可以看到它存在的

下面是本人用的一些黑名单tag
语言: 韩、德、法、意、俄、葡、西、越南
女性: amputee、futanari、guro、scat、vore、zombie、eggs
男性: yaoi、各种动物的英文、guro

暂时就这么多,最近写了一些爬虫想测测,但是没搞出什么名堂,下次见.jpg

539764.jpg

51183eec

B5F  2019-10-24 11:55
做个补充,搜索可以标签+标题两手抓,毕竟匹配机制是看一个作品只要标题/标签含有你搜索的关键字,就符合要求
比如你搜  射爆 garter belt
射爆显然不是标签,但是还是会给你这种结果
https://nhentai.net/g/281588/
因为garter belt是标签,射爆符合标题,所以依旧可以满足要求

539764.jpg

51183eec

B6F  2019-10-24 12:52

回 30楼(神圣之炎光) 的帖子

那是个合集,又不是只有萝莉

539764.jpg

51183eec

B7F  2019-10-26 13:19
更新,对搜索标签的一些tips,补充,以及关于黑名单

首先,可能大家会觉得标签这么打太累了,还要打什么character, perody之类的
所以还有个简化版的,NH和EXH都支持双引号的表达,也就是说,双引号里的内容会被认为是一个整体去进行匹配
"minami nitta"会让搜索引擎认为是找到标签含有完整的"minami nitta"而不会找只含有minami或者只含有nitta或者是调换了顺序的"nitta minami", 而这个标签显然只有新田美波符合要求

双引号可以减少你的打字量和记忆的脑容量 ,而且对于以空格分割的长标签是非常有效的,如果说"A B"还有重复的可能,那么"A1 A2 ... An"是基本只会代指一个事物的
注意: 一定要确定双引号里面的内容存在这种标签或者标题
比如"lolicon big breast"肯定不对,正确的应该是lolicon "big breast"

而像parody:original$  这种表达式什么时候有用呢,用做单词类元素并且有极高的重合率的词
比如朝峰テル老师的英文是‘tel’, 但是英文里tel开头的词太多了
所以你如果不打日文的话那你必须得用artist:tel,不过你也可以就搜tel然后快速找到作品点击标签就好了,总之条条大路通罗马,怎么方便怎么来,但是双引号确实更省事一些

黑名单这个事一言难尽,你很难界定什么是雷区,有些标签下的作品可能未必像你想象的那么反感甚至会爱上他,比如,我经常会发现[candy paddle (ネムネム)]的作品,成功掰弯了一些人

所以我的建议是,鉴于有些好本子不可避免的会加入一些你听上去反感的内容而被删掉,例如很多优秀的本子-单行本有部分触手play你不喜欢,而你既不想因为触手标签老是出现/一次性矫枉过正。鉴于此,你有两种解决办法

1. 用NH,NH加了黑名单只是模糊+马赛克处理,你还是可以点进去,这样如果是平时看的时候不会影响,想要收集而尽可能多的纳入时就可以尝试点进去这些被马赛克处理的本子
缺点:没有从本质上减少搜索结果的数量,平时很麻烦得翻好多页

2.EXH的黑名单管理有颜色功能,分为几类,一种是你打死也不想看到的,比如一些比较重口味的肢解,人兽...还有一些事有点反感但很可能出现在一些本子里面的情节,比如触手,肚子膨胀等,把这些标记为一种颜色,在你需要收集/地毯式搜索时打开,平时关闭,EXH是从本质上减少了搜索结果,让你不要有那么多页一个一个翻了
缺点:需要手动点,第二种TAG多了很麻烦啊

关于搜索减少结果数量的心得:通常,为了减少结果的数量,也就是多余的结果,减少翻页的时间,有如下基本tips
注意,这都是为了减少时间,如果真要收集狂肯定是地毯,100多页也得一页一页翻
1.  屏蔽所有其他与语言,只看日(中英)
通常来说,无论是中文还是英文,资源都不是日文的对手,可能在一些本子上会有例外,只有中文/英文,没日文版本,但是大趋势还是日文最多,只看日文得到的可能性最大,在不考虑语言只考虑看到的情况下可以这样做

2. 加上-anthology -tankoubon, anthology也就是选集,即为很多作家的作品混在一起出品的一部几百页的本子,通常这种会在以后有单独的汉化/日文版本放出,所以为了减少多余可以加上这个,单行本同理,是作者的连载系列+一些单独出的短页拼起来的,好处就是汉化的可能性大了,缺点就是重复计算。
有些关注度相对较低的作者,可能就只有选集/一个单行本最后的放出能看到他的作品,单独是不在网上的,你会损失一个机会
但是通常加上这两个可以减少不少结果,以我自己的显示为例子
"garter belt" bride
Showing 334 results. Your filters excluded 12 galleries from this page
"garter belt" bride -tankoubon -anthology    
Showing 168 results. Your filters excluded 15 galleries from this page

减少了一半左右,效率还是不错的
就这样,下次见.jpg