最近在做些 SEO 优化,在这里记录下。SEO 的目标是提高网站在搜索引擎结果中的排名位置,以 https://github.com/circle-hotaru/bilibili-comment2png 为例。
robots.txt
robots.txt 文件告诉搜索引擎爬虫可以从我们的网站请求哪些文件,一般情况下我们可以允许爬虫请求所有页面。
1 | # * |
sitemap.xml
sitemap.xml 向 Google 提供有关我们网站上的 URL 、更新时间以及权重等信息,以便 Google 可以轻松检测新内容并更有效地抓取我们的网站。更新 sitemap.xml 后可以到 Google search console 主动提交新的 sitemap.xml。
1 | <?xml version="1.0" encoding="UTF-8"?> |
Metadata
Metadata 是网页内容的摘要,主要是标题、描述和关键字。一切都是帮助爬虫更好地理解我们的网页。
1 | <title>Bilibili 评论转图片神器</title> |
Open Graph Protocol
由 Meta ( Facebook) 提出的一种开放网页信息标记协议,为网页提供更多结构化信息,方便网页在社交平台上分享、传播。
和前面提到的 Metadata 类似,但是它使用的是 property 属性。有几个基础的信息需要提供:
og:title
:网页内容的标题og:type
:网页内容的类型og:image
:网页的封面图片链接地址,用于卡片显示og:url
:一个提供 og 信息的权威地址,一般是当前网页地址
1 | <meta property="og:site_name" content="Bilibili 评论转图片神器" /> // 网站的名称 |
Twitter Cards
推特卡片是我们刷推特时经常看到的带有卡片的推特。和 OG 协议是类似,通过 Metadata 实现。
1 | <meta name="twitter:card" content="summary_large_image" /> |
一些需要注意的点,twitter:image
的 URL 使用绝对路径。有时候我们更新了信息,但是预览的时候还是旧的,可以到推特卡片验证器贴上 URL 刷新一下。
参考资料