那些所谓“原创”内容(旧文)


原创独立博客往往应该和“原创”划上等号,然而那些标榜“原创”的内容又有多少是原创?到处可见的“由xx原创,转摘标明出处”的内容。如果严格按照学术抄袭的原则来判断,这些“原创”和抄袭没有什么区别。


所谓“原创”内容

1.1%的“原创”文字,99%的“转摘”

全文转摘了来源他处的内容,在开篇或者是结尾说明“转摘于xx”。
问题是,这样的文章在结尾下面也有“由xx原创,转摘标明出处”的说明。这篇内容只有“转摘于xx”这1%的“原创”文字,其余99%都是转摘的。如果按照“原创”协议转摘,那么这篇内容到底应该标明转摘于谁?

2.10%的“原创”文字,90%的“转摘”

这种情况就比较常见了,经常搜索出来的文章都是这样。
虽然开篇和结尾的文字不一样,但是中间部分的大部分内容都是一样的,尤其是一些技术内容。
诚然,有一部分是直接标明了中间核心内容的来源,有一部分是搜索到了相关信息再用自己的语言来表述。
但是,不管是什么情况,这部分核心内容都不是由作者创造或发现的吧?

3.50%的“原创”文字,50%的“转摘”

虽然说是50%,其实很多狡辩为“100%”原创,因为文字100%都是作者自己写的。但是回归内容本身,其内容都是来源于其他地方。
比如提供一个问题的3三种方法,1来自于a博客,2来自于b百科,3来自于c网站。
这样的内容,除了文字,语言风格和排版这“50%”是作者的,其他还有什么是属于“原创”?不要说学术原则,光是小学生写作文的标准的足够判断了吧?
这种情况是标榜“原创”最“振振有词”的。

4.90%的“原创”文字,10%的“转摘”

这种情况比较隐蔽,而且更加普遍,常见于解决某一问题类的文章。
虽然全文90%的内容的的确确是原创,没有任何模仿。但是解决问题的核心方法却是来源他处。严格得看,去掉90%的说明,这10%的内容是不是已经足够了?
这个问题似乎只有Twitter之类的微博解决得好,因为文字有限。

5.100%的“原创”文字,100%的“转摘”

利用语言上的“不对称”,翻译某些外文内容,然后打上“原创”的标签。
比如很多外文程序,外文网站都有官方的help文件,但是没有本地化语言。某些网站或博客对其进行翻译并增加一些说明。
对于纯粹的翻译,判断也很简单:如果是原创,那么Google翻译是不是可以宣称所有可搜索到的文章都是属于Google翻译的原创?
有些情况可能还违法,比如未经允许翻译经济学人等文章,并发布在自己的网站上。

6.100%的“原创”文字,100%的“原创”内容

这种情况比较冤枉,主要是搜索引擎的判断。
比如针对一个问题,作者自己折腾出来一些方法,然后记录发布。但是这些方法可能“早已有之”,而且方法的关键字,关键句等还可能是完全相同,尤其是一些代码。由于SEO的存在,搜索引擎可能会误判。


严格得看,前5种情况都可以归属于非原创。但是并不是说不能写这5类文章,问题的关键在于是否硬要打上“由xx原创,转摘标明出处”的原创标签?尤其是网站挂有广告等收益内容。

P.S.

文章陈旧,已入回收站