为什么使用云电目录取证任意取证部分站点显示目录和文件名都相同?
出现此问题的原因:
云电取证平台是全程无人工干预的自动化取证软件,取证软件根据http(或https)协议访问被取证文件获取浏览器返回状态,即当返回状态不为404时(404表示该文件不存在,200表示访问正常,如下图),则自动获取访问后的浏览器中显示的网页内容,并将该内容保存至取证链接对应的路径和文件名的文件之中,由此显示文件路径(目录)和文件存在。
取证过程和保存的文件内容永远是客观的,不可人为干预或篡改,但被取证站点服务器的管理员可以使用技术手段让http(或https)请求不存在的文件时自动跳转至某一指定网页或非404状态,由此即可干扰取证服务器的自动判断结果,直接导致任何针对此类站点的取证结果都是所有目录路径和文件名相同。
举例说明:
有用户为了证明云电取证结果不客观,使用了任意软件作为参照权利软件,对www.alibaba.com网站进行了取证,得出了www.alibaba.com网站与权利软件目录路径、文件名全部相同的结论,如下图:
乍一看,有点蒙圈啊!!!难道这***网站侵权了?当然不是!
真实原因是,www.alibaba.com服务器对不存在的文件设置了http访问302跳转,如访问https://www.alibaba.com/dd.php等不存在的文件时,均会302跳转至https://error.alibaba.com/error404.htm网页,且浏览器最终状态码为200。因此,取证过程中,取证软件使用“https://www.alibaba.com/文件目录路径/文件名”构造的所有取证链接使用https访问时,均会跳转至error404.htm网页。如取证软件自动访问https://www.alibaba.com/behaviors/BargainBehavior.php时,取证日志显示如下:
显然,取证软件访问该链接时浏览器最终的状态码为200,自动跳转至http://error.alibaba.com/error404.htm,取证软件将网页内容保存至“www.alibaba.com_20230717220536/behaviors/BaseBehavior.php”文件中,由此得出了所有文件路径和文件均存在的统计结果。
文件目录路径和文件名的相同数据是否会影响证据效力?
使用云电目录取证电子证据时,不能抛开所固定的电子证据“文件内容和文件MD5值相同数据”孤立的依据“文件目录路径和文件名相同数据”来认定两款软件实质性相似。“文件目录路径和文件名相同数据”的使用需要建立在存在“MD5值相同文件数据”或“固定的文件内容中存在权利软件特有标识、名称等或存在与权利软件源代码相同(高度相似)的文件”的基础之上。换句话说,如果取证结果显示MD5值相同文件数为0,且所固定的任意一个文件中的内容基本相同,又找不到权利软件相关的标识、名称、简称等,或找不到与权利软件相同或相似的源代码文件,则无法通过“文件目录路径和文件名相同数据”来认定实质性相似;反之,如果存在大量或部分MD5值相同文件,又能在固定的证据文件中找到权利人相关的标识等,则“文件目录路径和文件名相同数据”就可以形成证据链作为认定实质性相似的依据。
回到上述举例的取证结果,虽然“权利文件(code.zip)检测目录路径:1079,文件总数6242,目标网站(https://www.alibaba.com)共有1079个目录路径,6242个文件名及路径”,但“0个文件的MD5值与权利文件相同”的结论即可初步推翻权利文件与目标网站实质性相似的结论。据此,我们可以进一步下载电子证据包勘验证据中的文件内容,打开任意文件内容进行比对,发现其内容基本一致(如下图),从而可以确定两者没有构成实质性相似的结论。