Epstein Files
1,79 miljoonaa sivua FBI-tutkimusasiakirjoja
Tervetuloa tutkimaan Yhdysvaltain oikeusministeriön (DOJ) julkaisemia Epstein Files -asiakirjoja. Tämä hakupalvelu antaa journalisteille ja tutkijoille suoran pääsyn lähes 1,79 miljoonaan sivuun FBI:n tutkinta-asiakirjoja, joiden tekstisisältö on koneellisesti purettu hakukelpoiseen muotoon.
Jokainen hakuosuma sisältää EFTA-dokumenttitunnuksen, jonka avulla voit paikantaa alkuperäisen asiakirjan DOJ:n julkaisussa. Aineisto kattaa kolme erillistä FBI-datasettia.
Tausta: Epstein Files
Jeffrey Epstein (1953–2019) oli yhdysvaltalainen rahoittaja, joka tuomittiin seksuaalirikoksista ja jota syytettiin laajamittaisesta alaikäisiin kohdistuneesta seksuaalisesta hyväksikäytöstä ja ihmiskaupasta. Hän kuoli vankilassa elokuussa 2019.
Yhdysvaltain kongressi hyväksyi vuonna 2024 Epstein Records Transparency Act -lain, joka velvoitti liittovaltion virastot julkaisemaan Epsteiniin liittyvät tutkinta-asiakirjat. Ensimmäinen julkaisu tapahtui 30. tammikuuta 2026, ja se sisälsi yli 178 gigatavua FBI:n tutkintamateriaalia.
Tämä hakupalvelu on rakennettu, koska alkuperäinen julkaisu — sadat tuhannet PDF-tiedostot ilman hakutoimintoa — on käytännössä tutkimuskelvoton ilman koneellista käsittelyä. Olemme purkaneet tekstisisällön ja rakentaneet kokotekstihaun, joka mahdollistaa journalistisen tutkimustyön.
Hakuohjeet
Valitse hakutyyppi: asiakirjahaku etsii kokotekstiä 1,79 miljoonasta sivusta, EFTA-haku hakee suoraan dokumenttitunnuksella ja sähköpostihaku kohdistuu Epsteinin sähköpostiarkistoon.
Lue lisää: Hakutyyppien selitykset ja vinkit
Asiakirjahaku (FTS5) etsii hakusanaa kaikista OCR-teksteistä. Tukee Boolean-operaattoreita: AND, OR, NOT. Esim. Helsinki AND Finnair
EFTA-haku hakee suoraan EFTA-dokumenttitunnuksella. Esim. EFTA00039826. Tukee jokerimerkkiä: EFTA000398*
Sähköpostihaku kohdistuu 16 447 sähköpostiviestiin (aihe, lähettäjä, sisältö).
Huom. OCR-laadusta: Tekstit on purettu koneellisesti PDF-tiedostoista. Kirjoitusvirheet ja tunnistusvirheet ovat mahdollisia — kokeile eri kirjoitusasuja.
Miksi Pohjoismainen rajaus? Aineistosta on tunnistettu yli 11 000 dokumenttia, joissa viitataan Pohjoismaihin — Suomeen, Ruotsiin tai Norjaan. Helsinki toimi Epsteinin verkoston kauttakulkupisteenä Schengen-alueelle, ja norjalaisilla kontakteilla oli poikkeuksellisen syvä dokumentoitu yhteys Epsteiniin. Pohjoismainen suodatin nostaa nämä dokumentit esiin 1,79 miljoonan sivun massasta.
7 sivua EFTA-numerolla "EFTA00285728"
2019 April Mon. April 1, 2019 Paris 12:00pm PHONE DATE w/Andrew Farkas (YOU are to call Andrew Tues. April 2, 2019 Paris-NY Reminder Neil Serebtyany will be in NY April 2-4 4:52pm Depart Paris 6:32pm Arrive NY 7:25pm to DEPART Paris via AF1144 (Rec. Loc#a Wed. April 3, 2019 NY Reminder: Jo...
1:30pm Appt w/Alan Dlugash and Rich Kahn (Alan 3:00pm Appt w/Steve Bannon (Snacks) 5:30pm Appt WI Fri. April S. 2019 NY Reminder: Dr. Bard in NY April 5-9, staying in apt• 8:00am Conference Call w Michael Wolff and Oliver Lloyd Worldwide number - Conference ID: Leader PIN: 10:15am Appt w/Ard...
5:00pm Appt tv/Dr. Bard a) 7:00pm Appt w/Mooch (M ) Sun. April 7.2019 NY-PB Reminder: Robert Kuhn to interview in NY w/mathematician Greg Chaitin; Danny Clunnovitz, plant expert and president of Ben Gurion Univ. 6:59am Depart NY 9:12am Arrive PB 4:15pm to arrive Miami via SU110 (Rec. Lot 4:...
Wed. April 10, 2019 LSJ Reminder: and on holiday Apri110-28, return to work on Mon. Apri129 Thurs. April 11. 2019 LSJ Reminder: to go to for cut and eyebrows 12:00pm Appt w/Attorney Clive Rivers at STC (organized by Cecile) Fri. April 12.2019 LS/ Sat. April 13.2019 LSI Sun. April 14.2019 ...
2:30pm Arrive NY 10:00am to have her hair cut with Patrick at 4:10pm to depart FK via LH401 (Rec. Loci Pick up by Car Service (confirn. booked throng 6:00 m DINNER w/Larty Summers (Julie is assistant: Cell: 7:20pm to Depart JFK via Aero ot#103 (Rec. L Pick up by Care Service (confirm b...
Thurs. April 25, 2019 Paris-Marrakech-Paris Reminder: in Miami with.May 8-12 10:31am Depart Paris 12:52pm Arrive Marrakech 7:41pm Depart Marrakech 11:23pm Arrive Paris Fri. Apri126. 2019 Park Reminder: St. Thomas Carnival weekend, Staff on holiday April 26-28 4:55pm to ARRIVE Paris CDG via...
7:30pm Opera Tues. April 30.2019 NY-LSI 8:30arn Appt w/Rich Kahn 11:05am Depart NY 2:25pm Arrive LSJ 11:30pm to depart Newark via Norwegian Air#7012(Rec. Loc EFTA00285734
Mitä tietokanta sisältää
Hakupalvelu yhdistää DOJ:n julkaisemat Epstein Files -datasetit, yhteensä lähes 1,79 miljoonaa sivua 901 000 EFTA-dokumenttia.
Tietokanta sisältää ainoastaan tekstidataa. Alkuperäisistä asiakirjoista on koneellisesti purettu vain tekstisisältö (OCR). Tietokannassa ei ole kuvia, videoita eikä muuta mediasisältöä. Tekstin erottaminen on tehty automatisoidusti ulkomaisessa palvelinympäristössä.
Lue lisää: Datasettien kuvaukset
Suurin yksittäinen aineisto: 1 221 217 sivua FBI:n tutkinta-asiakirjoja. Sisältää mm. Lesley Groffin kalenterimerkinnät, AmEx Centurion -matkadokumentit, FBI:n kuulustelupöytäkirjat (FD-302), sähköpostiviestejä, talousasiakirjoja ja viisumikirjeenvaihtoa. 528 735 uniikkia EFTA-dokumenttia.
Oikeudenkäynti- ja talousasiakirjat: 517 382 sivua. Sisältää mm. oikeudenkäyntipöytäkirjoja, todistajien lausuntoja, Maxwell-oikeudenkäynnin asiakirjoja ja IRS-verodokumentteja. 331 655 uniikkia EFTA-dokumenttia.
FBI:n ensimmäisen vaiheen tutkinta-asiakirjat: 10 212 sivua. Varhaisin aineisto tutkinnasta. 4 086 uniikkia EFTA-dokumenttia.
DOJ:n lisäjulkaisut: 40 549 sivua VOL00001-VOL00008 ja VOL00012. DS8 on suurin (29 349 sivua). Alkuperäisaineisto sisältää myös valvontakameravideoita ja äänitiedostoja, joista tietokantaan on tallennettu vain OCR-tekstisisältö. DS12 on DS11:n jatkoaineisto. 37 015 uniikkia EFTA-dokumenttia.
Miksi tämä hakupalvelu on olemassa
DOJ julkaisi Epstein Files -asiakirjat Transparency Act -lain nojalla 30. tammikuuta 2026. Alkuperäinen julkaisu sisältää miljoonia PDF-tiedostoja, joiden selailu on hidasta ja hankalaa.
Lue lisää: Aineiston tausta ja saatavuus
Miksi tekstihaku? Alkuperäiset asiakirjat ovat PDF-muodossa, eivätkä ne ole hakukelpoisia. Olemme purkaneet tekstisisällön koneellisella tekstintunnistuksella (OCR), jolloin jokainen journalisti voi nyt tehdä tarkkoja hakuja miljoonista sivuista sekunneissa.
Miksi Dataset 9 on erityinen? DS9 on laajin aineisto, mutta sen alkuperäiseen julkaisuun sisältyy myös kuva- ja videomateriaalia, joka voi sisältää alaikäisiä. Tämä on estänyt aineiston laajan tutkimuskäytön. Olemme erottaneet ainoastaan tekstipohjaisen sisällön koneellisesti, eikä tässä tietokannassa ole kuva- tai videosisältöä. Materiaali on prosessoitu täysin tekoälyavusteisesti Yhdysvalloissa, eikä materiaalipaketti ole missään vaiheessa ollut EU:n tai Suomen alueella.
EFTA-dokumenttitunnukset: Jokainen sivu on linkitetty alkuperäiseen EFTA-numeroituun PDF-tiedostoon. DOJ:n julkaisussa voit hakea alkuperäisen asiakirjan tällä tunnisteella.
Tärkeää tietoa aineiston käytöstä
Asiakirjojen tekstisisältö on purettu koneellisella tekstintunnistuksella (OCR). Tekstissä voi esiintyä tunnistusvirheitä. Tarkista aina alkuperäinen PDF-asiakirja ennen johtopäätösten tekemistä.
- Maininta asiakirjassa ei ole syytös eikä todiste rikoksesta
- OCR-tekstissä voi olla tunnistusvirheitä erityisesti nimissä ja numeroissa
- Monet asiakirjat sisältävät mustauksia (redactions) jotka estävät tekstin lukemisen
- Tietojen tulkinta ja ristiinviittaus on käyttäjän omalla vastuulla
Aineisto lukuina
Yirah.fi:n Epstein Files -hakupalvelu sisältää 1 789 360 sivua FBI-tutkinta-asiakirjoja 12 eri datasetista. Aineisto kattaa 901 491 uniikkia EFTA-dokumenttia ja 16 447 sähköpostiviestiä.
Pohjoismaisiksi tunnistetuista dokumenteista 16 577 viittaa Suomeen, Ruotsiin, Norjaan, Tanskaan tai Islantiin. Suomeen liittyviä dokumentteja on tunnistettu mm. Finnair-lentovarauksista, Helsinki-Vantaan kauttakulkureitiltä ja AmEx Centurion -matkadokumenteista.
Norjalaiset yhteydet ovat aineiston laajimmat pohjoismaiset yhteydet. Terje Rød-Larsenista (International Peace Institute) löytyy 1 665 dokumenttia, Thorbjørn Jaglandista (Euroopan neuvoston pääsihteeri) 1 030 dokumenttia. Kruununprinsessa Mette-Maritin vierailu Epsteinin Palm Beach -talossa tammikuussa 2012 on dokumentoitu Lesley Groffin kalenterimerkinnöissä.
Aineisto on OCR-käsitelty (koneellinen tekstintunnistus) alkuperäisistä FBI:n julkaisemista PDF-tiedostoista. Hakupalvelu tarjoaa kokotekstihaun, EFTA-dokumenttinumerohaun ja sähköpostihaun. Alkuperäiset PDF-tiedostot ovat saatavilla DOJ:n (U.S. Department of Justice) verkkosivuilla.
Aineiston sisältö ja keskeiset teemat
Tietokanta sisältää FBI:n tutkinta-asiakirjoja Jeffrey Epsteinin seksuaalirikostapauksesta. Alla keskeisiä teemoja ja dokumenttityyppejä joita aineistosta löytyy.
Henkilöt ja organisaatiot
Aineisto sisältää viittauksia satoihin henkilöihin, mm. Jeffrey Epstein, Ghislaine Maxwell, Lesley Groff, Sarah Kellen, Jean-Luc Brunel, Terje Rød-Larsen (International Peace Institute), Thorbjørn Jagland (Euroopan neuvosto), sekä lukuisia poliitikkoja, liikemiehiä ja julkisuuden henkilöitä. Organisaatioista esiintyvät mm. FBI, DOJ, International Peace Institute (IPI), World Economic Forum (WEF), MIT Media Lab, AmEx Centurion Travel ja useat mallitoimistot.
Maantieteelliset yhteydet
Dokumenteissa esiintyviä paikkoja: New York (9 East 71st Street), Palm Beach (Florida), Little St. James (Neitsytsaaret), Pariisi, Lontoo, Helsinki, Tukholma, Oslo, Moskova, Pietari, Vilna, Strasbourg, St. Moritz (Davos/WEF), sekä lukuisat hotellit, lentokentät ja yksityisasunnot. Pohjoismaiset yhteydet kattavat erityisesti Suomen (Helsinki-Vantaa, Finnair, Hotel Kämp), Norjan (kuninkaallinen perhe, Euroopan neuvosto, Nobel-komitea) ja Ruotsin (mallitoimistot, rekrytointiverkostot).
Dokumenttityypit
Aineistossa on mm. FBI:n kuulustelupöytäkirjoja (FD-302), sähköpostiviestejä, kalenterimerkintöjä (Lesley Groff), AmEx Centurion -matkadokumentteja, lentolippuja ja itineraareja, Finnair-varausvahvistuksia, passi- ja viisumitietoja, pankkisiirtoja ja talousasiakirjoja, oikeudenkäyntipöytäkirjoja, todistajanlausuntoja, FBI:n sisäisiä muistioita, WEF-osallistujalistoja, sekä median artikkeleita (WSJ, NYT, VG).
Tutkimusteemat
Keskeisiä tutkimusteemoja: rekrytointikoneiston rakenne (miten nuoria naisia löydettiin ja kuljetettiin), matkareittien dokumentaatio (erityisesti Helsinki–New York ja Pariisi–Moskova -reitit), rahoitusvirrat (Epsteinin säätiöt, IPI-lahjoitukset, henkilökohtaiset lainat), valtasuhteet (komentoketju Epstein → Groff → operatiiviset toimijat), sekä yhteydet poliittisiin ja diplomaattisiin verkostoihin.
Tietojen käyttö ja vastuuvapautus
Tämä hakupalvelu tarjoaa pääsyn Yhdysvaltain oikeusministeriön (DOJ) julkaisemiin Epstein Files -asiakirjoihin. Alkuperäinen data on julkisesti saatavilla DOJ:n sivuilla. Tekstisisältö on purettu koneellisesti OCR-menetelmällä ja tarjotaan sellaisenaan ilman muokkausta.
Yirah.fi ei ole muokannut asiakirjojen sisältöä. Palvelun tarkoitus on helpottaa journalistista tutkimustyötä tekemällä julkisesta aineistosta hakukelpoista.