Inicio rápido de Django

Requisitos previos

Proyecto de Django 4+
Una clave de la API de Firecrawl — consigue una gratis

Instala el SDK

pip install firecrawl-py

Añade tu clave de API a la configuración de Django o al entorno:

export FIRECRAWL_API_KEY=fc-YOUR-API-KEY

Crear vistas

Añade a tu aplicación Django las vistas de búsqueda, scraping e interacción. En views.py:

import json
import os
from django.http import JsonResponse
from django.views.decorators.csrf import csrf_exempt
from django.views.decorators.http import require_POST
from firecrawl import Firecrawl

firecrawl = Firecrawl(api_key=os.environ["FIRECRAWL_API_KEY"])


@csrf_exempt
@require_POST
def search_view(request):
    body = json.loads(request.body)
    results = firecrawl.search(body["query"], limit=body.get("limit", 5))
    return JsonResponse(
        [{"title": r.title, "url": r.url} for r in results.web],
        safe=False,
    )


@csrf_exempt
@require_POST
def scrape_view(request):
    body = json.loads(request.body)
    result = firecrawl.scrape(body["url"])
    return JsonResponse({
        "markdown": result.markdown,
        "metadata": result.metadata,
    })


@csrf_exempt
@require_POST
def interact_start_view(request):
    body = json.loads(request.body)
    result = firecrawl.scrape(body["url"], formats=["markdown"])
    return JsonResponse({"scrape_id": result.metadata.scrape_id})


@csrf_exempt
@require_POST
def interact_view(request):
    body = json.loads(request.body)
    response = firecrawl.interact(body["scrape_id"], prompt=body["prompt"])
    return JsonResponse({"output": response.output})


@csrf_exempt
@require_POST
def interact_stop_view(request):
    body = json.loads(request.body)
    firecrawl.stop_interaction(body["scrape_id"])
    return JsonResponse({"status": "stopped"})

Configura las URL

En urls.py:

from django.urls import path
from . import views

urlpatterns = [
    path("api/search/", views.search_view),
    path("api/scrape/", views.scrape_view),
    path("api/interact/start/", views.interact_start_view),
    path("api/interact/", views.interact_view),
    path("api/interact/stop/", views.interact_stop_view),
]

Pruébalo

python manage.py runserver

# Buscar en la web
curl -X POST http://localhost:8000/api/search/ \
  -H "Content-Type: application/json" \
  -d '{"query": "firecrawl web scraping", "limit": 5}'

# Hacer scraping de una página
curl -X POST http://localhost:8000/api/scrape/ \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

# Iniciar una sesión interactiva
curl -X POST http://localhost:8000/api/interact/start/ \
  -H "Content-Type: application/json" \
  -d '{"url": "https://www.amazon.com"}'

Comando de administración

Usa Firecrawl en un comando de administración de Django para scripts y pipelines de datos. Crea management/commands/scrape.py:

import os
from django.core.management.base import BaseCommand
from firecrawl import Firecrawl


class Command(BaseCommand):
    help = "Hacer scraping de una URL e imprimir el markdown"

    def add_arguments(self, parser):
        parser.add_argument("url", type=str)

    def handle(self, *args, **options):
        firecrawl = Firecrawl(api_key=os.environ["FIRECRAWL_API_KEY"])
        result = firecrawl.scrape(options["url"])
        self.stdout.write(result.markdown)

python manage.py scrape https://example.com

Siguientes pasos

Documentación de scraping

Todas las opciones de scraping, incluidos formatos, acciones y proxies

Documentación de búsqueda

Busca en la web y obtén el contenido completo de la página

Documentación de Interact

Haz clic, completa formularios y extrae contenido dinámico

Referencia del SDK de Python

Referencia completa del SDK con rastreo, mapeo, async y más

Primeros pasos

Endpoints principales

Más

Inicios rápidos

Guías para desarrolladores

Webhooks

Casos de uso

Dashboard

Contribuir

Django

Requisitos previos

Instala el SDK

Crear vistas

Configura las URL

Pruébalo

Comando de administración

Siguientes pasos

Documentación de scraping

Documentación de búsqueda

Documentación de Interact

Referencia del SDK de Python

Primeros pasos

Endpoints principales

Más

Inicios rápidos

Guías para desarrolladores

Webhooks

Casos de uso

Dashboard

Contribuir

Documentation Index

​Requisitos previos

​Instala el SDK

​Crear vistas

​Configura las URL

​Pruébalo

​Comando de administración

​Siguientes pasos

Documentación de scraping

Documentación de búsqueda

Documentación de Interact

Referencia del SDK de Python

Requisitos previos

Instala el SDK

Crear vistas

Configura las URL

Pruébalo

Comando de administración

Siguientes pasos