@ 社区模板
通过 MCP 协议提供强大的网页抓取、搜索和深度研究能力。
Firecrawl MCP Server 接受查询文本,利用 Firecrawl 的网页抓取能力,返回最相关的网页内容,支持从多种网页中提取文本,并将其转换为 Markdown/HTML 格式,供 LLM(大语言模型)进行处理和生成。
| 工具标识 | 功能描述 | 核心参数 |
|---|---|---|
firecrawl_scrape | 抓取单个网页内容,支持 JavaScript 渲染,返回清理后的文本内容。 | url(网页 URL),formats(返回格式,如 ["markdown"]),waitFor(等待时间,毫秒),timeout(超时时间,毫秒),mobile(是否使用移动视图) |
firecrawl_map | 映射网站,发现所有索引的 URL。 | url(网站 URL),search(可选的搜索词),ignoreSitemap(是否忽略 sitemap.xml),includeSubdomains(是否包括子域名),limit(最大 URL 数量) |
firecrawl_search | 在网页中搜索指定内容,返回匹配的结果。 | query(查询文本),limit(返回的结果数量),lang(语言),country(国家),scrapeOptions(抓取选项) |
firecrawl_crawl | 启动异步抓取,支持多页面提取。 | url(网站 URL),excludePaths (排除路径),includePaths (包含路径), maxDepth(最大深度),limit(最大页面数),allowExternalLinks(是否允许外部链接),deduplicateSimilarURLs(是否去重相似 URL) |
firecrawl_check_crawl_status | 检查爬虫爬取状态。 | id(爬虫任务ID) |
firecrawl_extract | 从页面中提取结构化数据。 | urls(网页 URL 列表),prompt (用于 LLM 提取的自定义提示词), systemPrompt (指导 LLM 的系统提示词), schema (用于结构化数据提取的 JSON 模式), allowExternalLinks (允许从外部链接提取信息), enableWebSearch (启用网页搜索以获取额外上下文), includeSubdomains (在提取时包含子域名) |
firecrawl_deep_research | 执行深入的多源研究,提供摘要和来源。 | query(查询文本),maxDepth(最大深度), timeLimit (时间限制 秒), maxUrls (要分析的最大 URL 数量, 默认50) |
firecrawl_generate_llmstxt | 为特定领域生成 LLMs.txt 文件。 | url(要分析的网站的基础 URL),maxUrls 要包含的最大 URL 数量(默认:10), showFullText 是否在响应中包含 llms-full.txt 的内容 |
https://github.com/mendableai/firecrawl-mcp-server