Trust & verification methodology

Version 1.0

Every report on the map carries a trust judgement so you can see how much to rely on it, not just what it says. We grade trust on three independent axes and combine two of them into a single user-facing badge. Every grade level is taken from an established standard; the few numeric cut-offs we had to choose are flagged as ours. This is open-source intelligence tradecraft applied to crowdsourced disaster data, not a black box.

Why three axes and not one number? NATO doctrine (STANAG 2511) is explicit that the reliability of a source and the credibility of a specific claim must be judged separately. A trustworthy outlet can still get one report wrong; an unknown account can still be right. Collapsing them into a single 0–100 score is the most common documented failure, so we keep them apart.

The badge

A defined function of Axis 1 (source reliability) and Axis 2 (information credibility):

Badge	Means	When
⛑ Inspected	On-site engineering inspection (ground-truth).	An accredited inspector assessed the building in person to ATC-20 + EMS-98. First-hand, so it sits above corroboration-based Verified.
✓ Verified	Corroborated by independent sources.	Credibility A (first-hand) or B (≥2 independent origins), and the source is not graded "not reliable".
Reported	Said, but from a single source / not yet corroborated.	Credibility C: one independent origin (even if it posted many times), or an untested source.
Unverified	No assessable source, or reliability in doubt.	Credibility D/E (anonymous, bare-platform, or suspected false), or a "not reliable" source.

Inspeccionado: the ground-truth tier. The rest of this page grades second-hand reports. An inspection is first-hand: a structural engineer assessed the building on site, the very judgement we say elsewhere a social post cannot make. Source: the SismoAyuda VE post-earthquake inspection program. Standards cited on every record: ATC-20 (Applied Technology Council postearthquake safety placard, green = apparently safe, yellow = restricted entry, red = unsafe) and EMS-98 (European Macroseismic Scale damage grade, G1 to G5). Each record's popup names the inspector, the method and the standard. An inspection is a point-in-time field judgement, not a permanent guarantee of safety.

The key honesty property. Corroboration counts distinct independent sources, not raw posts. A fact can show n_fuentes: 100 yet stay Reported because all 100 posts trace to one source. That surfaces circular reporting (one claim echoed) instead of hiding it behind a big number. About 93% of our reports are single-source, so most honestly read "Reported", and that is the point.

Axis 1 · Source reliability

Per source. Scale adopted from the UK College of Policing 3×5×2 intelligence grading:

Reliable	Established outlet, official / scientific body (e.g. FUNVISIS, USGS, NASA), or a curated, source-cited aggregator.
Untested	No track record yet. The honest default (= Admiralty "F"). Not pejorative: most crowd sources sit here.
Not reliable	Reasonable grounds to doubt the source. Reserved for evidenced cases.

How it is assigned (today): a type-prior. We seed grades from source type (a registry of the ~45 outlets that cover most of the volume, plus the pipeline's own outlet classification), and default everything else to Untested. This is a starting prior, labelled method: type-prior on every record, not a measured track record. The doctrinally correct upgrade (a computed per-source accuracy statistic, the "Accu" model, that scores how often a source's claims are later independently corroborated) is the next phase; it needs accumulated history we are still gathering.

Axis 2 · Information credibility

Per report. Computed from the deduped source list. Scale from UK 3×5×2 information evaluation:

A	First-hand (a source that witnessed it).
B	Independently corroborated: ≥2 origins "not from the same original source".
C	Single-source / uncorroborated.
D	Unattributed: anonymous or bare-platform only, no assessable source.
E	Suspected false (contradicted).

We compute B / C / D directly. A and E require reading the text (witness language; an active contradiction) and are not auto-assigned in v1, so we deliberately under-claim to C rather than guess A.

Independence (the careful part)

Distinct canonical identities. One source posting five times is one origin, not five. Name variants are folded to one id (for example lamega967 and La Mega).
Aggregators are dropped from the count. A curated re-publisher (terremotovenezuela.com, RedQuipu, acopiovzla) reposting a claim is not extra corroboration. It is marked aggregator and excluded from independent origins, though it still appears in the source list.
Partner datasets are counted once, as a professional origin. NZSEE (the New Zealand Society for Earthquake Engineering, nzsee.org.nz) shares its hand-curated building assessments directly with this project. Their engineers assess damage remotely from public media, so each NZSEE record is marked partner, graded reliable, and counts as ONE independent origin — not an on-site inspection, and the per-record media links carry the underlying evidence anyone can check. Canonical citation: NZSEE's public Learning from Earthquakes report (VERT Venezuela 2026), which names crisisvenezuela.org as a collaborating party.
Bare platforms are not a source. facebook.com / instagram.com with no specific author carry no independent weight.

Known limit (v2). Independence is judged by source name. We do not yet detect when several distinct accounts post the same underlying video (a media-level echo). That would over-count independence in rare cases; it is a planned upgrade (perceptual media hashing), labelled method: canonical-id-v1 so you know which version produced the number.

Axis 3 · Damage confidence

Damage reports only. Ordinal grades from the Copernicus EMS / UNOSAT scale, read from the report text:

Destroyed	Total collapse (our `nivel=colapso_total`).
Damaged	Heavy to light structural damage (`severo` / `parcial`).
Possibly damaged	Lower-confidence / generic damage language (`dano`).

Damage read from text is a proxy and near-real-time estimate, not ground truth (Copernicus). It says nothing about whether a building is safe to occupy. That is an on-site engineering judgement (ATC-20) no one can make from a post.

Coordinate precision

Separate from trust, every point carries a coord_origen tag so a map pin is never mistaken for a surveyed location:

explicita	The coordinate came with the source (a partner dataset, or stated in the post). Precise.
geocodificada	We derived it from the place name via a geocoder (OpenStreetMap / Nominatim). Approximate — see accuracy below.
(none)	No coordinate could be determined; the report is listed without a pin.

Geocoder accuracy, measured against ground truth: resolving a Venezuelan place name to a point has a ~1 km median error, with about half landing in the correct neighborhood and a ~27% gross-error rate (>5 km); roughly 44% of un-coordinated reports cannot be geocoded at all and are left without a pin rather than guessed. Because of this, a geocoded point is never presented as if it were surveyed, un-locatable reports are routed to human verification rather than machine estimates, and on the map an approximate pin is flagged "ubicación aproximada." About 43% of currently located points are geocodificada.

What is computed, prior, or assumed

Computed: credibility B/C/D and independent-origin counting (from the source list).
Type-prior: source reliability (from source type, not yet a measured track record).
Assumed: the Verification Handbook 4-element check (provenance / source / date / location). The badge currently assumes it passes; wiring it as a real gate is pending, shown as checks.status: "assumed".
Our chosen cut-offs (no standard fixes a number): "Verified needs ≥2 independent origins"; the badge mapping A/B→Verified, C→Reported, D/E→Unverified. The grade definitions are cited; the thresholds are our documented editorial choice.

In the API

Every record in the open-data API carries a confianza object with the badge and all three axes, so you can filter or re-derive trust yourself. Per-source kind is exposed inside fuentes[], and each record carries a coord_origen precision tag (explicita = from source, geocodificada = our ~1 km geocoder estimate).

Sources: US Army FM 2-22.3 (Admiralty source/credibility matrix); NATO STANAG 2511 (independence of the two axes); UK College of Policing 3×5×2 / 5×5×5 (the adopted grade definitions, "independent, not from the same original source"); Verification Handbook (the 4-element check); ACLED Codebook (single-source floor, "quantity is not quality"); Copernicus EMS & UNOSAT / IWG-SEM (the damage scale); ATC-20 (Applied Technology Council, Procedures for Postearthquake Safety Evaluation of Buildings, the green/yellow/red placards); EMS-98 (Grünthal ed., European Macroseismic Scale 1998, building damage grades G1–G5); Dong, Berti-Équillé & Srivastava 2009 (source-accuracy / copy detection); Li & Gao et al. 2016 (truth-discovery survey, why full ML does not fit sparse data). Full design notes live in the project repo (SOURCE_TRUST_MODEL.md).

Metodología de confianza y verificación

Versión 1.0

Cada reporte en el mapa lleva un juicio de confianza, para que veas cuánto fiarte de él, no solo lo que dice. Calificamos la confianza en tres ejes independientes y combinamos dos de ellos en una sola insignia visible. Cada nivel proviene de un estándar establecido; los pocos umbrales numéricos que tuvimos que elegir están marcados como nuestros. Esto es oficio de inteligencia de fuentes abiertas aplicado a datos ciudadanos de desastre, no una caja negra.

¿Por qué tres ejes y no un solo número? La doctrina de la OTAN (STANAG 2511) es explícita: la fiabilidad de una fuente y la credibilidad de una afirmación concreta deben juzgarse por separado. Un medio confiable puede equivocarse en un reporte; una cuenta desconocida puede tener razón. Colapsarlos en un solo puntaje de 0 a 100 es la falla mejor documentada, así que los mantenemos separados.

La insignia

Una función definida del Eje 1 (fiabilidad de la fuente) y el Eje 2 (credibilidad de la información):

Insignia	Significa	Cuándo
⛑ Inspeccionado	Evaluación de ingeniería en sitio (verdad sobre el terreno).	Un inspector evaluó el edificio en persona según ATC-20 + EMS-98. Es de primera mano, por eso está por encima de Verificado.
✓ Verificado	Corroborado por fuentes independientes.	Credibilidad A (de primera mano) o B (≥2 orígenes independientes), y la fuente no está calificada como "no fiable".
Reportado	Dicho, pero de una sola fuente / aún sin corroborar.	Credibilidad C: un solo origen independiente (aunque haya publicado muchas veces), o una fuente sin historial.
Sin verificar	Sin fuente evaluable, o fiabilidad en duda.	Credibilidad D/E (anónimo, solo-plataforma, o sospecha de falsedad), o una fuente "no fiable".

Inspeccionado: la verdad sobre el terreno. El resto de esta página califica reportes de segunda mano. Una inspección es de primera mano: un ingeniero estructural evaluó el edificio en sitio, justo el juicio que en otras partes decimos que una publicación no puede hacer. Fuente: el programa de inspección post-sismo de SismoAyuda VE. Normas citadas en cada registro: ATC-20 (placa de seguridad post-sismo del Applied Technology Council, verde = aparentemente seguro, amarillo = entrada restringida, rojo = inseguro) y EMS-98 (Escala Macrosísmica Europea, grado de daño G1 a G5). La ventana de cada registro nombra al inspector, el método y la norma. Una inspección es un juicio de campo puntual, no una garantía permanente de seguridad.

La propiedad clave de honestidad. La corroboración cuenta fuentes independientes distintas, no publicaciones en bruto. Un hecho puede mostrar n_fuentes: 100 y aún así quedar como Reportado porque las 100 publicaciones provienen de una sola fuente. Eso revela el reporte circular (una afirmación repetida) en vez de esconderlo tras un número grande. Cerca del 93% de nuestros reportes son de una sola fuente, así que la mayoría dice honestamente "Reportado", y ese es el punto.

Eje 1 · Fiabilidad de la fuente

Por fuente. Escala adoptada de la calificación de inteligencia 3×5×2 del UK College of Policing:

Fiable	Medio establecido, organismo oficial / científico (p. ej. FUNVISIS, USGS, NASA), o un agregador curado y con fuentes citadas.
Sin probar	Aún sin historial. El valor por defecto honesto (= "F" del Admiralty). No es peyorativo: la mayoría de las fuentes ciudadanas están aquí.
No fiable	Motivos razonables para dudar de la fuente. Reservado para casos con evidencia.

Cómo se asigna (hoy): un prior por tipo. Sembramos las calificaciones según el tipo de fuente (un registro de los ~45 medios que cubren la mayor parte del volumen, más la clasificación de medios del propio sistema), y todo lo demás queda por defecto en Sin probar. Es un prior inicial, etiquetado method: type-prior en cada registro, no un historial medido. La mejora doctrinalmente correcta (un estadístico de exactitud por fuente calculado, el modelo "Accu", que mide con qué frecuencia las afirmaciones de una fuente se corroboran luego de forma independiente) es la siguiente fase; requiere historia acumulada que todavía estamos reuniendo.

Eje 2 · Credibilidad de la información

Por reporte. Calculado a partir de la lista de fuentes deduplicada. Escala de la evaluación de información 3×5×2 del UK:

A	De primera mano (una fuente que lo presenció).
B	Corroborado de forma independiente: ≥2 orígenes "no provenientes de la misma fuente original".
C	De una sola fuente / sin corroborar.
D	Sin atribución: solo anónimo o solo-plataforma, sin fuente evaluable.
E	Sospecha de falsedad (contradicho).

Calculamos B / C / D directamente. A y E requieren leer el texto (lenguaje de testigo; una contradicción activa) y no se asignan automáticamente en la v1, así que deliberadamente sub-declaramos a C en vez de adivinar A.

Independencia (la parte delicada)

Identidades canónicas distintas. Una fuente que publica cinco veces es un origen, no cinco. Las variantes de nombre se unifican a un id (por ejemplo lamega967 y La Mega).
Los agregadores se excluyen del conteo. Un re-publicador curado (terremotovenezuela.com, RedQuipu, acopiovzla) que reposta una afirmación no es corroboración adicional. Se marca aggregator y se excluye de los orígenes independientes, aunque sigue apareciendo en la lista de fuentes.
Los conjuntos de datos de socios cuentan una vez, como origen profesional. NZSEE (la Sociedad de Ingeniería Sísmica de Nueva Zelanda, nzsee.org.nz) comparte sus evaluaciones de edificios directamente con este proyecto. Sus ingenieros evalúan el daño de forma remota a partir de medios públicos, así que cada registro NZSEE se marca partner, se gradúa confiable y cuenta como UN origen independiente — no es inspección en sitio, y los enlaces de cada registro llevan a la evidencia que cualquiera puede revisar. Cita canónica: el informe público de NZSEE (Learning from Earthquakes, VERT Venezuela 2026), que nombra a crisisvenezuela.org como parte colaboradora.
Una plataforma desnuda no es una fuente. facebook.com / instagram.com sin un autor específico no aportan peso independiente.

Límite conocido (v2). La independencia se juzga por el nombre de la fuente. Todavía no detectamos cuándo varias cuentas distintas publican el mismo video subyacente (un eco a nivel de medio). Eso sobrecontaría la independencia en casos raros; es una mejora planificada (hashing perceptual de medios), etiquetada method: canonical-id-v1 para que sepas qué versión produjo el número.

Eje 3 · Confianza del daño

Solo reportes de daño. Grados ordinales de la escala Copernicus EMS / UNOSAT, leídos del texto del reporte:

Destruido	Colapso total (nuestro `nivel=colapso_total`).
Dañado	Daño estructural de severo a leve (`severo` / `parcial`).
Posiblemente dañado	Lenguaje de daño genérico / de menor confianza (`dano`).

El daño leído del texto es un indicador y estimación en tiempo casi real, no la verdad sobre el terreno (Copernicus). No dice nada sobre si un edificio es seguro para habitar. Eso es un juicio de ingeniería en sitio (ATC-20) que nadie puede hacer desde una publicación.

Precisión de las coordenadas

Aparte de la confianza, cada punto lleva una etiqueta coord_origen para que un pin del mapa nunca se confunda con una ubicación inspeccionada:

explicita	La coordenada vino con la fuente (un conjunto de datos socio, o indicada en la publicación). Precisa.
geocodificada	La derivamos del nombre del lugar con un geocodificador (OpenStreetMap / Nominatim). Aproximada — ver precisión abajo.
(ninguna)	No se pudo determinar coordenada; el reporte se lista sin pin.

Precisión del geocodificador, medida contra verdad de terreno: resolver un nombre de lugar venezolano a un punto tiene un error mediano de ~1 km, con cerca de la mitad cayendo en el vecindario correcto y una tasa de error grave de ~27% (>5 km); cerca del 44% de los reportes sin coordenada no pueden geocodificarse y se dejan sin pin en vez de adivinarlos. Por eso, un punto geocodificado nunca se presenta como inspeccionado, los reportes sin ubicar se enrutan a verificación humana en vez de estimaciones automáticas, y en el mapa un pin aproximado se marca "ubicación aproximada". Cerca del 43% de los puntos ubicados actualmente son geocodificada.

Qué se calcula, qué es prior y qué se asume

Calculado: credibilidad B/C/D y el conteo de orígenes independientes (de la lista de fuentes).
Prior por tipo: fiabilidad de la fuente (del tipo de fuente, todavía no un historial medido).
Asumido: la verificación de 4 elementos del Verification Handbook (procedencia / fuente / fecha / ubicación). La insignia asume por ahora que pasa; cablearlo como una compuerta real está pendiente, mostrado como checks.status: "assumed".
Nuestros umbrales elegidos (ningún estándar fija un número): "Verificado necesita ≥2 orígenes independientes"; el mapeo de insignias A/B→Verificado, C→Reportado, D/E→Sin verificar. Las definiciones de grado están citadas; los umbrales son nuestra elección editorial documentada.

En la API

Cada registro en la API de datos abiertos lleva un objeto confianza con la insignia y los tres ejes, para que puedas filtrar o recalcular la confianza por tu cuenta. El kind por fuente se expone dentro de fuentes[], y cada registro lleva una etiqueta de precisión coord_origen (explicita = de la fuente, geocodificada = nuestra estimación con geocodificador de ~1 km).

Fuentes: US Army FM 2-22.3 (matriz de fuente/credibilidad del Admiralty); NATO STANAG 2511 (independencia de los dos ejes); UK College of Policing 3×5×2 / 5×5×5 (las definiciones de grado adoptadas, "independiente, no de la misma fuente original"); Verification Handbook (la verificación de 4 elementos); ACLED Codebook (piso de fuente única, "la cantidad no es calidad"); Copernicus EMS y UNOSAT / IWG-SEM (la escala de daño); ATC-20 (Applied Technology Council, procedimientos de evaluación de seguridad post-sismo, las placas verde/amarillo/rojo); EMS-98 (Grünthal ed., Escala Macrosísmica Europea 1998, grados de daño G1–G5); Dong, Berti-Équillé y Srivastava 2009 (exactitud de fuente / detección de copia); Li y Gao et al. 2016 (estudio de descubrimiento de la verdad, por qué el ML completo no encaja con datos escasos). Las notas de diseño completas están en el repo del proyecto (SOURCE_TRUST_MODEL.md).