301、302跳转时到底文件存不存在?
人们使用http或https访问某个网址时,偶尔会跳转至另外一个页面,网站是如何实现跳转的呢?访问的这个文件到底存不存在呢?
我们首先来看看网页跳转的技术路线。一般而言,软件开发者会使用301或302重定向规则跳转网页,而实现跳转的技术路径通常会有以下几种:
1、通过web服务器环境配置将指定访问路径或全部不存在的路径进行跳转,此种情况访问的文件一般是不存在的;
2、通过web服务器防火墙配置将指定路径或部分敏感路径进行跳转,此种情况访问的文件一般是不存在的;
3、通过web服务器中的站点软件文件或路由进行跳转,使用文件跳转访问的文件一般是存在的,使用路由跳转访问的文件一般是不存在的;
由此可见,当访问的路径(文件)通过301、302跳转后,很难通过技术方法判断该文件是否存在。云电目录取证结果中的“文件目录路径和文件名相同数据”需要结合所固定的文件内容及MD5值文件相同数综合使用。
正因通过技术手段无法自动判断设置了跳转的文件路径是否真实存在,云电取证软件在处理301、302跳转的文件路径也存在着两种方案,第一种方案是“无论需要固证的访问链接是否跳转,只要不是404状态,取证软件均固定浏览器最终返回的状态和文件内容”,第二种方案是“碰到301、302跳转状态码,取证软件则终止该访问链接的继续取证,并将结果统计为路径和文件不存在”。我们团队在开发升级过程中对这两种方案进行了多轮激烈的讨论,目前采用了第一种方案,我们认为该方案的优点是,即便文件不存在,取证软件亦可获取跳转后的网页内容,后续证据使用者可以根据固定的网页内容结合相同MD5值文件数量综合判断被取证的站点是否与权利文件实质性相似。虽然该种取证方案会导致不理解云电目录取证工作原理和取证结果统计数据使用原则的人产生误解,但文件内容和取证日志可以真实反应被取证站点的客观状况,也可以最大限度地保障取证用户的合法权益。
但通过一年多来的司法实践后,我们发现云电取证平台当前对于301、301跳转路径所使用的机制客观上给不精通软件开发技术的律师、法官和部分当事人带来了理解困扰。为此,我们正在优化目录取证的该项功能,后续尽可能通过取证软件的升级使得取证统计结果更加容易理解,敬请期待!