Tres preguntas que se deben hacer cuando trabajas con bases de datos
- Claudia Yaujar-Amaro

- 5 feb
- 4 min de lectura
Por Factchequeado

Antes de trabajar con cifras, estadísticas y bases de datos, es importante tener un propósito lo más acotado posible: ¿Qué quieres medir exactamente?, ¿existen bases de datos públicas de esto o no?, ¿qué datos no vas a poder encontrar?
Pregunta 1: Origen
¿Quién produjo estos datos, quién los recopiló, cómo y por qué? Es decir, qué interés tiene la base de datos.
● ¿La fuente es confiable?
● ¿Cuál es la metodología que se usó para recopilarlos? ¿Su metodología está a la vista y es transparente? ¿la entendemos? ¿es replicable?
● ¿Cuál es el propósito de quien genera estos datos? Verifica si provienen de instituciones oficiales o privadas, qué limitaciones tienen y si ostentan credibilidad.
● ¿Qué fenómenos importantes quedan fuera de esta medición?
Ejemplos:
1. DATOS DE CRIMINALIDAD: Los departamentos de policía podrían mostrar algún comunicado donde dicen que aumentó el crimen, basado en el número de arrestos, pero sin mencionar que en sus registros de datos también hay una variable que muestra que en ese mismo periodo aumentaron los operativos.
2. DATOS DE POBREZA: Las cifras de pobreza varían según quién define la “línea de pobreza” y cómo se mide el ingreso.
3. DATOS DE INMIGRANTES EN FRONTERA: Supón que la Patrulla Fronteriza (CBP) publica una tabla con “encuentros” (encounters) de migrantes en la frontera suroeste por mes y nacionalidad.
○ ¿Quién genera esos datos? ¿Provienen de CBP a nivel nacional, de una oficina regional o de un contratista externo?
○ ¿Cómo definen “encuentro”? Para eso, revisa las definiciones oficiales.
○ ¿Incluye solo detenciones entre puertos de entrada, repeticiones de la misma persona en un mismo mes?
○ ¿Cómo se recopilan los datos? ¿Es un registro administrativo en tiempo real, un muestreo, una estimación?
○ ¿Para qué se producen estos datos? ¿Para justificar más presupuesto, para mostrar que aumentó o “bajó” la migración, para cumplir un mandato legal?
Pregunta 2: Calidad
¿Los datos están completos, están actualizados y son precisos?
Revisa la cobertura geográfica, temporal, ajustes estacionales y posibles errores o lagunas. De esto previenen las interpretaciones erróneas.
● ¿De qué periodo son los datos? (año fiscal vs. calendario, meses completos o parciales)
● ¿Cuál es el tamaño de la muestra?
● ¿Todas las regiones reportan igual? (¿falta algún estado o sector?)
● ¿Hubo cambios en la forma de contar entre periodos?
● ¿Hay meses sin datos sin explicación?
● ¿Los números coinciden entre diferentes fuentes oficiales del mismo fenómeno?
● ¿Están usando la misma definición que en años anteriores?
Cuando compares años diferentes, siempre pregúntate: ¿Cambió la forma de medir?
Ejemplo:
1. DETENCIONES DE ICE: Base de personas en custodia de ICE por país de origen y género.
○ Cobertura: ¿Solo adultos o incluye menores? ¿Solo centros grandes o todos los condados?
○ Temporalidad: ¿Año fiscal (octubre-septiembre) o año calendario? ¿Están actualizados?
○ Precisión: ¿Hay errores en la identificación de nacionalidad? ¿Tienen desglose diario o solo mensual?
2. POBLACIÓN EN CUSTODIA: Imagina que ves esta cifra en un comunicado oficial: “La población en custodia de ICE bajó 20% este trimestre”.
○ Pregunta: ¿Bajó porque hay menos arrestos nuevos o porque deportaron masivamente a quienes ya estaban en custodia?
○ Puede ser que haya menos arrestos en la frontera por los cambios de política migratoria.
○ O puede ser que sean los mismos arrestos, pero más deportaciones porque hay más operativos.
Si se revisan bien los datos, podría resultar que bajó la población en custodia un 20%, pero era por deportaciones masivas y no porque hubo menos gente llegando.
Cruza los datos de “población en custodia” con “deportaciones ejecutadas” del mismo periodo. Analiza si subieron las deportaciones y ahí tienes una respuesta.
Pregunta 3: Análisis
¿Qué patrones, tendencias o anomalías revelan los datos al cruzarlos?
Compara periodos, cruza variables y busca patrones para generar hipótesis narrativas.
Ejemplo:
ANÁLISIS POR CRIMINALIDAD: El FBI tiene la base de datos “Uniform Crime Reporting” (UCR), con la que puedes ver tendencias y cruces de datos. Supón que esa base tiene las tasas de homicidios por 100,000 habitantes, por tipo de arma y ciudad grande: fbi.gov/services/cjis/ucr. Analiza, compara y encuentra anomalías.
○ Compara por periodos:
- 2019 (antes de la pandemia): 5.0 homicidios por cada 100,000.
- 2020: Sube un 30 % a 6.5 homicidios durante las protestas por el asesinato de George Floyd durante la pandemia del COVID-19.
- Analiza un año contra otro: 2025 vs. 2024.
○ Cruza variables:
- Año vs. tipo de arma.
- Ciudad vs. alcalde demócrata o republicano.
- Mes vs. periodos específicos (pandemia, protestas, etcétera).
○ Detecta anomalías: 2023: Washington D. C. registró una tasa de homicidios de 40 por cada 100,000, la máxima en 20 años, pero bajó 35 % en 2024. ¿Por qué? Cruza esos datos con los de ventas de armas y revisa en los datos: ¿hubo más compras de armas durante periodos de protestas o no? ¿Subieron los robos de autos, pero los homicidios bajaron?
Es importante ver tendencias como esta: Entre 2022 y 2025, los robos de autos Hyundai y Kia subieron más de 400% en ciudades como Chicago, Milwaukee y Los Ángeles, según datos del FBI y la National Insurance Crime Bureau (NICB). Así que, mientras los homicidios han bajado en 21% en 2025, los robos totales subieron alrededor del 10% a nivel nacional.


Comentarios