← crisisvenezuela.org

Trust & verification methodology

Version 1.0

Every report on the map carries a trust judgement so you can see how much to rely on it, not just what it says. We grade trust on three independent axes and combine two of them into a single user-facing badge. Every grade level is taken from an established standard; the few numeric cut-offs we had to choose are flagged as ours. This is open-source intelligence tradecraft applied to crowdsourced disaster data, not a black box.

Why three axes and not one number? NATO doctrine (STANAG 2511) is explicit that the reliability of a source and the credibility of a specific claim must be judged separately. A trustworthy outlet can still get one report wrong; an unknown account can still be right. Collapsing them into a single 0–100 score is the most common documented failure, so we keep them apart.

The badge

A defined function of Axis 1 (source reliability) and Axis 2 (information credibility):

BadgeMeansWhen
⛑ InspectedOn-site engineering inspection (ground-truth).An accredited inspector assessed the building in person to ATC-20 + EMS-98. First-hand, so it sits above corroboration-based Verified.
✓ VerifiedCorroborated by independent sources.Credibility A (first-hand) or B (≥2 independent origins), and the source is not graded "not reliable".
ReportedSaid, but from a single source / not yet corroborated.Credibility C: one independent origin (even if it posted many times), or an untested source.
UnverifiedNo assessable source, or reliability in doubt.Credibility D/E (anonymous, bare-platform, or suspected false), or a "not reliable" source.
Inspeccionado: the ground-truth tier. The rest of this page grades second-hand reports. An inspection is first-hand: a structural engineer assessed the building on site, the very judgement we say elsewhere a social post cannot make. Source: the SismoAyuda VE post-earthquake inspection program. Standards cited on every record: ATC-20 (Applied Technology Council postearthquake safety placard, green = apparently safe, yellow = restricted entry, red = unsafe) and EMS-98 (European Macroseismic Scale damage grade, G1 to G5). Each record's popup names the inspector, the method and the standard. An inspection is a point-in-time field judgement, not a permanent guarantee of safety.
The key honesty property. Corroboration counts distinct independent sources, not raw posts. A fact can show n_fuentes: 100 yet stay Reported because all 100 posts trace to one source. That surfaces circular reporting (one claim echoed) instead of hiding it behind a big number. About 93% of our reports are single-source, so most honestly read "Reported", and that is the point.

Axis 1 · Source reliability

Per source. Scale adopted from the UK College of Policing 3×5×2 intelligence grading:

ReliableEstablished outlet, official / scientific body (e.g. FUNVISIS, USGS, NASA), or a curated, source-cited aggregator.
UntestedNo track record yet. The honest default (= Admiralty "F"). Not pejorative: most crowd sources sit here.
Not reliableReasonable grounds to doubt the source. Reserved for evidenced cases.

How it is assigned (today): a type-prior. We seed grades from source type (a registry of the ~45 outlets that cover most of the volume, plus the pipeline's own outlet classification), and default everything else to Untested. This is a starting prior, labelled method: type-prior on every record, not a measured track record. The doctrinally correct upgrade (a computed per-source accuracy statistic, the "Accu" model, that scores how often a source's claims are later independently corroborated) is the next phase; it needs accumulated history we are still gathering.

Axis 2 · Information credibility

Per report. Computed from the deduped source list. Scale from UK 3×5×2 information evaluation:

AFirst-hand (a source that witnessed it).
BIndependently corroborated: ≥2 origins "not from the same original source".
CSingle-source / uncorroborated.
DUnattributed: anonymous or bare-platform only, no assessable source.
ESuspected false (contradicted).

We compute B / C / D directly. A and E require reading the text (witness language; an active contradiction) and are not auto-assigned in v1, so we deliberately under-claim to C rather than guess A.

Independence (the careful part)

Known limit (v2). Independence is judged by source name. We do not yet detect when several distinct accounts post the same underlying video (a media-level echo). That would over-count independence in rare cases; it is a planned upgrade (perceptual media hashing), labelled method: canonical-id-v1 so you know which version produced the number.

Axis 3 · Damage confidence

Damage reports only. Ordinal grades from the Copernicus EMS / UNOSAT scale, read from the report text:

DestroyedTotal collapse (our nivel=colapso_total).
DamagedHeavy to light structural damage (severo / parcial).
Possibly damagedLower-confidence / generic damage language (dano).

Damage read from text is a proxy and near-real-time estimate, not ground truth (Copernicus). It says nothing about whether a building is safe to occupy. That is an on-site engineering judgement (ATC-20) no one can make from a post.

Coordinate precision

Separate from trust, every point carries a coord_origen tag so a map pin is never mistaken for a surveyed location:

explicitaThe coordinate came with the source (a partner dataset, or stated in the post). Precise.
geocodificadaWe derived it from the place name via a geocoder (OpenStreetMap / Nominatim). Approximate — see accuracy below.
(none)No coordinate could be determined; the report is listed without a pin.

Geocoder accuracy, measured against ground truth: resolving a Venezuelan place name to a point has a ~1 km median error, with about half landing in the correct neighborhood and a ~27% gross-error rate (>5 km); roughly 44% of un-coordinated reports cannot be geocoded at all and are left without a pin rather than guessed. Because of this, a geocoded point is never presented as if it were surveyed, un-locatable reports are routed to human verification rather than machine estimates, and on the map an approximate pin is flagged "ubicación aproximada." About 43% of currently located points are geocodificada.

What is computed, prior, or assumed

In the API

Every record in the open-data API carries a confianza object with the badge and all three axes, so you can filter or re-derive trust yourself. Per-source kind is exposed inside fuentes[], and each record carries a coord_origen precision tag (explicita = from source, geocodificada = our ~1 km geocoder estimate).

Sources: US Army FM 2-22.3 (Admiralty source/credibility matrix); NATO STANAG 2511 (independence of the two axes); UK College of Policing 3×5×2 / 5×5×5 (the adopted grade definitions, "independent, not from the same original source"); Verification Handbook (the 4-element check); ACLED Codebook (single-source floor, "quantity is not quality"); Copernicus EMS & UNOSAT / IWG-SEM (the damage scale); ATC-20 (Applied Technology Council, Procedures for Postearthquake Safety Evaluation of Buildings, the green/yellow/red placards); EMS-98 (Grünthal ed., European Macroseismic Scale 1998, building damage grades G1–G5); Dong, Berti-Équillé & Srivastava 2009 (source-accuracy / copy detection); Li & Gao et al. 2016 (truth-discovery survey, why full ML does not fit sparse data). Full design notes live in the project repo (SOURCE_TRUST_MODEL.md).

Metodología de confianza y verificación

Versión 1.0

Cada reporte en el mapa lleva un juicio de confianza, para que veas cuánto fiarte de él, no solo lo que dice. Calificamos la confianza en tres ejes independientes y combinamos dos de ellos en una sola insignia visible. Cada nivel proviene de un estándar establecido; los pocos umbrales numéricos que tuvimos que elegir están marcados como nuestros. Esto es oficio de inteligencia de fuentes abiertas aplicado a datos ciudadanos de desastre, no una caja negra.

¿Por qué tres ejes y no un solo número? La doctrina de la OTAN (STANAG 2511) es explícita: la fiabilidad de una fuente y la credibilidad de una afirmación concreta deben juzgarse por separado. Un medio confiable puede equivocarse en un reporte; una cuenta desconocida puede tener razón. Colapsarlos en un solo puntaje de 0 a 100 es la falla mejor documentada, así que los mantenemos separados.

La insignia

Una función definida del Eje 1 (fiabilidad de la fuente) y el Eje 2 (credibilidad de la información):

InsigniaSignificaCuándo
⛑ InspeccionadoEvaluación de ingeniería en sitio (verdad sobre el terreno).Un inspector evaluó el edificio en persona según ATC-20 + EMS-98. Es de primera mano, por eso está por encima de Verificado.
✓ VerificadoCorroborado por fuentes independientes.Credibilidad A (de primera mano) o B (≥2 orígenes independientes), y la fuente no está calificada como "no fiable".
ReportadoDicho, pero de una sola fuente / aún sin corroborar.Credibilidad C: un solo origen independiente (aunque haya publicado muchas veces), o una fuente sin historial.
Sin verificarSin fuente evaluable, o fiabilidad en duda.Credibilidad D/E (anónimo, solo-plataforma, o sospecha de falsedad), o una fuente "no fiable".
Inspeccionado: la verdad sobre el terreno. El resto de esta página califica reportes de segunda mano. Una inspección es de primera mano: un ingeniero estructural evaluó el edificio en sitio, justo el juicio que en otras partes decimos que una publicación no puede hacer. Fuente: el programa de inspección post-sismo de SismoAyuda VE. Normas citadas en cada registro: ATC-20 (placa de seguridad post-sismo del Applied Technology Council, verde = aparentemente seguro, amarillo = entrada restringida, rojo = inseguro) y EMS-98 (Escala Macrosísmica Europea, grado de daño G1 a G5). La ventana de cada registro nombra al inspector, el método y la norma. Una inspección es un juicio de campo puntual, no una garantía permanente de seguridad.
La propiedad clave de honestidad. La corroboración cuenta fuentes independientes distintas, no publicaciones en bruto. Un hecho puede mostrar n_fuentes: 100 y aún así quedar como Reportado porque las 100 publicaciones provienen de una sola fuente. Eso revela el reporte circular (una afirmación repetida) en vez de esconderlo tras un número grande. Cerca del 93% de nuestros reportes son de una sola fuente, así que la mayoría dice honestamente "Reportado", y ese es el punto.

Eje 1 · Fiabilidad de la fuente

Por fuente. Escala adoptada de la calificación de inteligencia 3×5×2 del UK College of Policing:

FiableMedio establecido, organismo oficial / científico (p. ej. FUNVISIS, USGS, NASA), o un agregador curado y con fuentes citadas.
Sin probarAún sin historial. El valor por defecto honesto (= "F" del Admiralty). No es peyorativo: la mayoría de las fuentes ciudadanas están aquí.
No fiableMotivos razonables para dudar de la fuente. Reservado para casos con evidencia.

Cómo se asigna (hoy): un prior por tipo. Sembramos las calificaciones según el tipo de fuente (un registro de los ~45 medios que cubren la mayor parte del volumen, más la clasificación de medios del propio sistema), y todo lo demás queda por defecto en Sin probar. Es un prior inicial, etiquetado method: type-prior en cada registro, no un historial medido. La mejora doctrinalmente correcta (un estadístico de exactitud por fuente calculado, el modelo "Accu", que mide con qué frecuencia las afirmaciones de una fuente se corroboran luego de forma independiente) es la siguiente fase; requiere historia acumulada que todavía estamos reuniendo.

Eje 2 · Credibilidad de la información

Por reporte. Calculado a partir de la lista de fuentes deduplicada. Escala de la evaluación de información 3×5×2 del UK:

ADe primera mano (una fuente que lo presenció).
BCorroborado de forma independiente: ≥2 orígenes "no provenientes de la misma fuente original".
CDe una sola fuente / sin corroborar.
DSin atribución: solo anónimo o solo-plataforma, sin fuente evaluable.
ESospecha de falsedad (contradicho).

Calculamos B / C / D directamente. A y E requieren leer el texto (lenguaje de testigo; una contradicción activa) y no se asignan automáticamente en la v1, así que deliberadamente sub-declaramos a C en vez de adivinar A.

Independencia (la parte delicada)

Límite conocido (v2). La independencia se juzga por el nombre de la fuente. Todavía no detectamos cuándo varias cuentas distintas publican el mismo video subyacente (un eco a nivel de medio). Eso sobrecontaría la independencia en casos raros; es una mejora planificada (hashing perceptual de medios), etiquetada method: canonical-id-v1 para que sepas qué versión produjo el número.

Eje 3 · Confianza del daño

Solo reportes de daño. Grados ordinales de la escala Copernicus EMS / UNOSAT, leídos del texto del reporte:

DestruidoColapso total (nuestro nivel=colapso_total).
DañadoDaño estructural de severo a leve (severo / parcial).
Posiblemente dañadoLenguaje de daño genérico / de menor confianza (dano).

El daño leído del texto es un indicador y estimación en tiempo casi real, no la verdad sobre el terreno (Copernicus). No dice nada sobre si un edificio es seguro para habitar. Eso es un juicio de ingeniería en sitio (ATC-20) que nadie puede hacer desde una publicación.

Precisión de las coordenadas

Aparte de la confianza, cada punto lleva una etiqueta coord_origen para que un pin del mapa nunca se confunda con una ubicación inspeccionada:

explicitaLa coordenada vino con la fuente (un conjunto de datos socio, o indicada en la publicación). Precisa.
geocodificadaLa derivamos del nombre del lugar con un geocodificador (OpenStreetMap / Nominatim). Aproximada — ver precisión abajo.
(ninguna)No se pudo determinar coordenada; el reporte se lista sin pin.

Precisión del geocodificador, medida contra verdad de terreno: resolver un nombre de lugar venezolano a un punto tiene un error mediano de ~1 km, con cerca de la mitad cayendo en el vecindario correcto y una tasa de error grave de ~27% (>5 km); cerca del 44% de los reportes sin coordenada no pueden geocodificarse y se dejan sin pin en vez de adivinarlos. Por eso, un punto geocodificado nunca se presenta como inspeccionado, los reportes sin ubicar se enrutan a verificación humana en vez de estimaciones automáticas, y en el mapa un pin aproximado se marca "ubicación aproximada". Cerca del 43% de los puntos ubicados actualmente son geocodificada.

Qué se calcula, qué es prior y qué se asume

En la API

Cada registro en la API de datos abiertos lleva un objeto confianza con la insignia y los tres ejes, para que puedas filtrar o recalcular la confianza por tu cuenta. El kind por fuente se expone dentro de fuentes[], y cada registro lleva una etiqueta de precisión coord_origen (explicita = de la fuente, geocodificada = nuestra estimación con geocodificador de ~1 km).

Fuentes: US Army FM 2-22.3 (matriz de fuente/credibilidad del Admiralty); NATO STANAG 2511 (independencia de los dos ejes); UK College of Policing 3×5×2 / 5×5×5 (las definiciones de grado adoptadas, "independiente, no de la misma fuente original"); Verification Handbook (la verificación de 4 elementos); ACLED Codebook (piso de fuente única, "la cantidad no es calidad"); Copernicus EMS y UNOSAT / IWG-SEM (la escala de daño); ATC-20 (Applied Technology Council, procedimientos de evaluación de seguridad post-sismo, las placas verde/amarillo/rojo); EMS-98 (Grünthal ed., Escala Macrosísmica Europea 1998, grados de daño G1–G5); Dong, Berti-Équillé y Srivastava 2009 (exactitud de fuente / detección de copia); Li y Gao et al. 2016 (estudio de descubrimiento de la verdad, por qué el ML completo no encaja con datos escasos). Las notas de diseño completas están en el repo del proyecto (SOURCE_TRUST_MODEL.md).