攻防世界WEB新手区1-4

攻防世界(WEB)新手区1-4分析

1.view_source (难度系数: 1.0)##

  • 题目来源: Cyberpeace-n3k0

  • 题目描述:X老师让小宁同学查看一个网页的源代码,但小宁同学发现鼠标右键好像不管用了。

(1)打开页面

1.png

(2)分析:本题主要是在考察怎么查看网页源代码查看方式(这里博主使用的Microsoft Edge浏览器)

a.点击鼠标右键(本题鼠标右键使用不了,要使用其他方法)

3.png

b.使用快捷键 CTRL+U

c.在整个网址前添加 “view-source:”

 eg.view-source:http://111.200.241.244:54909/
  • ps.这是博主目前知道的方法。

2.robots (难度系数: 1.0)##

  • 题目来源: Cyberpeace-n3k0

  • 题目描述:X老师上课讲了Robots协议,小宁同学却上课打了瞌睡,赶紧来教教小宁Robots协议是什么吧。

(1)打开网页,显示空白页

(2)分析:根据题意在网址后添加 /robots.txt 可得

4.png

(3)把/f1ag_1s_h3re.php添加到原网址后面即可得到flag
6.png

注:以下关于robots协议的内容来自百度百科https://baike.baidu.com/item/Robots%E5%8D%8F%E8%AE%AE/2483797

  • 简单介绍:robots协议也叫robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不应被搜索引擎的漫游器获取的,哪些是可以被漫游器获取的。因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。
    robots协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。

-Robots协议用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站点的一些死链接。方便搜索引擎抓取网站内容;设置网站地图连接,方便引导蜘蛛爬取页面。

  • 文件写法

User-agent: *

Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录

Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。

Disallow: /? 禁止访问网站中所有包含问号 (?) 的网址

Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片

Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。

Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录

Allow: .htm$ 仅允许访问以”.htm”为后缀的URL。

Allow: .gif$ 允许抓取网页和gif格式图片

Sitemap: 网站地图 告诉爬虫这个页面是网站地图

  • 文件用法

例1. 禁止所有搜索引擎访问网站的任何部分

User-agent: *

Disallow: /

例2. 允许所有的robot访问 (或者也可以建一个空文件 “/robots.txt” file)

User-agent: *

Allow: /

例3. 禁止某个搜索引擎的访问

User-agent: BadBot

Disallow: /

例4. 允许某个搜索引擎的访问

User-agent: Baiduspider

allow:/

3.backup(难度系数: 1.0)

  • 题目来源: Cyberpeace-n3k0

  • 题目描述:X老师忘记删除备份文件,他派小宁同学去把备份文件找出来,一起来帮小宁同学吧!

(1)打开网页
7.png

(2)根据题意地址栏最末加上/index.php~或/index.php.bak得到备份文件,再用txt打开便可的到flag

8.png

ps.常见的备份文件后缀名有 .git .svn .swp .~ .bak .bash_history

4.cookie(难度系数: 1.0)

  • 题目来源: Cyberpeace-n3k0
  • 题目描述:X老师告诉小宁他在cookie里放了些东西,小宁疑惑地想:‘这是夹心饼干的意思吗?’

(1)打开页面
9.png

(2)使用浏览器中的开发者工具

12.png

(3)在地址后加上/cookie.php,根据页面显示在打开开发者工具,得到flag

11.png

  • ps

(1)关于HTTP响应可以阅读这篇文章https://www.biancheng.net/http/response.html

(2)Cookie介绍(该段来自https://www.jianshu.com/p/6fc9cea6daa2

HTTP协议本身是无状态的。什么是无状态呢,即服务器无法判断用户身份。Cookie实际上是一小段的文本信息(key-value格式)。客户端向服务器发起请求,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端浏览器会把Cookie保存起来。当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器。服务器检查该Cookie,以此来辨认用户状态。

打个比方,我们去银行办理储蓄业务,第一次给你办了张银行卡,里面存放了身份证、密码、手机等个人信息。当你下次再来这个银行时,银行机器能识别你的卡,从而能够直接办理业务。

打赏
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2021-2023 00hello00

请我喝杯咖啡吧~

支付宝
微信