Pular para o conteúdo principal
POST
/
map
Mapear várias URLs com base em opções
curl --request POST \
  --url https://api.firecrawl.dev/v2/map \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "url": "<string>",
  "search": "<string>",
  "sitemap": "include",
  "includeSubdomains": true,
  "ignoreQueryParameters": true,
  "limit": 5000,
  "location": {
    "country": "US",
    "languages": [
      "en-US"
    ]
  },
  "timeout": 60000
}
'
{
  "success": true,
  "links": [
    {
      "url": "<string>",
      "title": "<string>",
      "description": "<string>"
    }
  ]
}

Novidades da v2

Controle aprimorado de sitemaps

Três formas de lidar com sitemaps:
  • "include" - Usar o sitemap e encontrar outras páginas (padrão)
  • "skip" - Ignorar completamente o sitemap
  • "only" - Retornar apenas as URLs do sitemap
{
  "url": "https://example.com",
  "sitemap": "only"
}

Formato da resposta alterado

Agora retornamos os links no array de objetos links com metadados aprimorados.
{
  "url": "https://example.com",
  "links": [
    {
      "url": "https://example.com/page1",
      "title": "Page 1",
      "description": "Page 1 description"
    }
  ]
}

Autorizações

Authorization
string
header
obrigatório

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Corpo

application/json
url
string<uri>
obrigatório

URL base de onde o rastreamento será iniciado

Especifique uma consulta de pesquisa para ordenar os resultados por relevância. Exemplo: "blog" retornará URLs que contenham a palavra "blog" na URL, ordenadas por relevância.

sitemap
enum<string>
padrão:include

Modo de uso do sitemap durante o mapeamento. Se você definir como skip, o sitemap não será usado para encontrar URLs. Se você definir como only, apenas URLs que estiverem no sitemap serão retornadas. Por padrão (include), o sitemap e outros métodos serão usados em conjunto para encontrar URLs.

Opções disponíveis:
skip,
include,
only
includeSubdomains
boolean
padrão:true

Incluir subdomínios do site

ignoreQueryParameters
boolean
padrão:true

Não retorne URLs com parâmetros de query

limit
integer
padrão:5000

Número máximo de links retornados

Intervalo obrigatório: x <= 100000
timeout
integer

Tempo limite, em milissegundos. Não há tempo limite definido por padrão.

location
object

Configurações de localização para a requisição. Quando especificadas, será usado um proxy apropriado, se disponível, e serão emulados o idioma e o fuso horário correspondentes. O padrão é 'US' caso não seja especificado.

Resposta

Resposta bem-sucedida

success
boolean