【k哥爬虫普法】Python程序员爬取视频资源13万部,一分钱没挣,获刑2年!

【k哥爬虫普法】Python程序员爬取视频资源13万部,一分钱没挣,获刑2年!

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了”K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情介绍

2017年以来,被告人王世杰工作期间,为利用自己所学计算机网络技术建立网站赚钱,租用云服务器开办了一个名为”酷奇XX视频”的视频网站。利用爬虫技术在互联网上爬取未经著作权人授权许可的电影、电视剧、综艺、动漫等各类视频资源,包括《流浪地球》、《复仇者联盟4》、《大闹天空》等最新影视剧,以及淫秽主播视频表演等视频。

此后,王世杰通过在视频网站网页上挂载”广告位招租”招商广告,招商广告中载明自己的QQ号码,伺机通过视频资源牟利。且王世杰通过网站设置了一个会员注册信息,用户可以用手机号或者邮箱账号注册成为会员,会员可以通过在线支付现金购买充值卡,1元兑换1积分,不同积分可升级为阶梯式包时段的会员,享受该网站提供的各种VIP会员服务。

2019年5月8日,勉县公安局受案后,民警依法对”酷奇XX视频”网站的信息进行了在线提取,其中提取各类涉嫌侵犯著作权影视作品601部,疑似淫秽物品视频238部。

同年5月18日,阿里云公司工作人员因发现”酷奇XX视频”网站信息与备案不符,将”酷奇XX视频”网站关停。

同年5月21日,经汉中市公安局对从”酷奇XX视频”网站中提取的45部福利视频鉴定,意见为:送检的2张DVD光盘内视频文件名称01至45的45部视频录像为淫秽及色情物品。

同年5月30日,民警在上海市易果电子商务有限公司办公室将被告人王世杰抓获,在其家中扣押黑色台式组装电脑主机一台,并依法提取了电子数据。

同年9月6日,经汉中市公安局对从”酷奇XX视频”网站中提取的总计238部福利视频鉴定,意见为:移动硬盘内视频文件名称编号为001至238的238部视频录像为淫秽及色情物品。

截止”酷奇XX视频”网站被关停时,该网站共有会员55人,提供各类视频总计13万余部,其中有电影5.1万余部,电视剧2.2万余部,综艺2.3万余部,动漫2.4万余部等,福利其它9085部,其中已提取固定视频839部(含福利视频238部,普通电影视频601部)。

截止案发,未发现有注册会员支付款项。同时,网站转载的部分视频中存在镶嵌式广告,在案件侦查过程中也没有发现王世杰有实际广告收入。

公诉机关据此认为被告人王世杰的行为构成侵犯著作权罪、传播淫秽物品罪,建议对其判处二年以上三年以下有期徒刑,可适用缓刑,并处罚金。
被告人王世杰对起诉书指控的犯罪事实无异议,自愿认罪,请求对其从轻处罚。

供辩情况

本案重点在供述的时候,辩护人对犯罪事实无异议,但辩称:1、本案中,被告人王世杰没有营利目的;2、对公诉机关指控被告人王世杰构成侵犯著作权罪有异议。建立链接不同于复制发行,亦不属于提供作品,王世杰没有侵犯著作权的主观故意和客观行为,且侵犯著作权罪是数额犯,王世杰并没有实际获利,故不构成侵犯著作权罪;3、被告人王世杰没有传播淫秽物品的故意,只是因为没有做好网站的管理工作,疏忽大意。爬虫技术是对访问行为的模仿,无法自我识别、甄别淫秽视频;

但实际上法院也一一驳回了

因为法院认为被告人在网站网页上挂载”广告位招租”窗口,招商广告中载明自己的QQ号码为联系方式;还在网站中设置了会员注册、在线支付、积分兑换等,其具有营利目的、且其行为属于复制发行。以营利为目的,未经著作权人、录音录像制作者许可,通过互联网向公众传播他人电影、电视作品601部,情节严重,其行为构成侵犯著作权罪;

其次,被告人王世杰作为视频网站的创建人和管理者,理应加强网站的管理和维护,其在采用爬虫技术时,未对相关影视进行甄别,对淫秽视频的传播持放任态度,其主观上具有传播淫秽物品的故意,利用互联网传播淫秽音像视频238部,情节严重,其行为亦构成传播淫秽物品罪

判决情况

被告人王世杰犯侵犯著作权罪,判处有期徒刑一年零六个月,并处罚金人民币5000元;犯传播淫秽物品罪,判处有期徒刑八个月。

二罪并罚,决定执行有期徒刑二年,缓刑二年零六个月,并处罚金人民币5000元。

反思总结

很明显,案例中的当事人就是想爬一些电影视频资源放到自己网站,通过会员制度和广告来盈利,除了这种爬取视频资源的情况,还有不少人通过爬虫技术爬取技术博主的原创文章,放到自己的网站上,这种做法通常也会在网站上植入广告来盈利,还有的是为了给网站做 SEO 优化,提高网站权重,也有的给文章设置付费内容、扫码关注公众号才解锁内容等,这种未经过原作者允许进行恶意采集并盈利的行为,无疑都是侵犯著作权的,也是可以被判刑的。

不少人想将爬虫作为副业赚钱,也有很多人信奉”技术无罪”,要知道”技术无罪”论,自从快播案后就是不存在的,利用爬虫赚钱,应走正道,目的和手段都要合法合规,也一定要注意是否侵犯了别人的隐私权和著作权,切莫心存歪念,因小失大。当然利用爬虫技术传播淫秽物品更是我们不能触及的红线!

常见的”仅用于内部学习交流,不得传播”的避风港原则,在人人影视案之后也不存在了,因此公司如果有类似的项目,技术和运营团队都有义务对所爬取的内容进行甄别,利用人工智能、NLP等技术,对文本、图片、视频进行合法性鉴别,甚至要有专门的数据治理部门,对于违法内容理应立即销毁。

爬虫技术基本上来说是一个加速便捷工具,如果你业务不合规,手动执行都是违法的,那么大规模高效获取只会加速灭亡,因此在使用效率技术前一定要想清楚自己业务的商业模式是否合法合规,要么就不做,要做就得加强合规建设。

【k哥爬虫普法】Python程序员爬取视频资源13万部,一分钱没挣,获刑2年!

Original: https://www.cnblogs.com/ikdl/p/16668945.html
Author: K哥爬虫
Title: 【k哥爬虫普法】Python程序员爬取视频资源13万部,一分钱没挣,获刑2年!

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/591290/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 如何使用Pandas操作数据

    Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。 一、数据结构 pandas的主要…

    Python 2023年8月16日
    063
  • Pygame入门 2022 (2)

    Python 2023年5月24日
    046
  • Cenots7 离线安装部署PostgreSQL

    1 PostgreSQL源码包下载并复制 1.1 PostgreSQL源码包下载: 访问PostgreSQL官网 选择所需版本进行下载,本次下载安装版本为v14.5 1.2 复制源…

    Python 2023年10月17日
    037
  • groupby分组聚合和运算

    本文是对《利用Python进行数据分析》中关于groupby进行分组聚合和运算的一个回顾性总结,整体而言,在过去的一年的工作中,用到groupby的场景还是蛮多的,尤其是利用它与相…

    Python 2023年8月7日
    079
  • pyhon爬虫模拟网页登陆、正则表达式

    前言:不是每个网页都能模拟成功,仅供学习 模拟网页登陆 –安装模块–pip install urllib (运行cmd输入此段代码即可安装) 点击查看代码 …

    Python 2023年11月9日
    036
  • Qt——信号与槽知识总结归纳

    一.含义与使用 (一).含义 (二).connect使用 (三).信号函数 (四).槽函数 二.示例 一.含义与使用 信号与槽是qt中一种常用的通信手段。发送方发送信号,接收方通过…

    Python 2023年10月27日
    042
  • C++matplotlibcpp配置、使用及发布(第三方无需安装python即可运行)

    目录 1.介绍 2.环境配置 3.matplotlibcpp使用 4.发布 1.介绍 matplotlibcpp,是简单的C++绘图库。其底层是利用的python中的工具包matp…

    Python 2023年8月30日
    0108
  • openCV 第四篇 角点检测、图像特征、图片拼接

    本文原本打算直接简单介绍一下harris和sift,之后进行特征匹配,来一波图像拼接。 想来想去还是先介绍下原理吧,虽然没人看QAQ。可以直接点击右侧目录跳转到代码区。 本文可以完…

    Python 2023年9月26日
    055
  • 将conda 虚拟环境添加到 Jupyter lab内核

    在conda中有多个虚拟环境,将其添加到jupyter lab中,便于在jupyter lab中切换环境。 首先在conda中创建一个tensorflow的虚拟环境(一定需要指定p…

    Python 2023年9月9日
    044
  • 为了删除数万封邮件,使用python模拟鼠标自动点击删除

    公司的企业邮箱有段时间不知道为啥没有删除服务器上的邮件,屯了几万封。登陆企业邮网站,又不好清空邮箱,只能每次一页删除100封,光靠鼠标在那里点,真的费时费力。于是写了个python…

    Python 2023年10月30日
    046
  • 90个Pandas案例

    文章很长,高低要忍一下,如果忍不了,那就收藏吧,总会用到的 为了方便查找,先提供目录,一步定位! 如何使用列表和字典创建 Series * 使用列表创建 Series 使用 nam…

    Python 2023年8月7日
    032
  • 16.引言篇——自定义过滤器及标签

    引言——在前面讲述了如何使用Django内置的过滤器,这在我们进行某些项目开发时很是方便。但是,内置的过滤器毕竟有限(当内置的满足不了我们的需求该怎么办?),但是规则是死的,人是活…

    Python 2023年8月6日
    053
  • Python测试开发&Pytest基础指南

    下方查看历史精选文章 ******************************** 微信搜一搜 或 长按加群 开源优测 Original: https://blog.csdn….

    Python 2023年9月14日
    040
  • 爬虫日记(21):使用Pipeline模块写入文件二

    前面学习了Pipeline模块写入文件,这个例子非常简单,一学就会,不过这个例子也有一个重要的缺陷,对于一般的数据量也许感觉不出来,如果对于数百万,或者数千万的量级就会体现出来。不…

    Python 2023年10月4日
    027
  • Python– pandas使用小技巧(一)

    pandas使用小技巧(一) 使用map对某些列做特征工程 import pandas as pd data = { ‘color’:[‘red’,’blue’,’black’,’…

    Python 2023年8月19日
    055
  • python的基本知识

    python是流行的编程语言,效率高,易扩展调试。用于游戏开发,创建web程序,解决商业问题,研究型处理数据工具。介于c和shell之间,解释型脚本语言,可以跨平台运行,数据类型为…

    Python 2023年9月24日
    026
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球