Ми знайдемо вас: пошук ДНК, який використовується для вбивства Голден-Стейт-Вбивці, може проживати біля 60% білих американців

Джозеф Деанджело, підозрюваний вбивця Голден Стейт

Ренді Пенч / TNS / Newscom

Ми знайдемо вас: пошук ДНК, який використовується для вбивства Голден-Стейт-Вбивці, може проживати біля 60% білих американців

Автор Джоселін КайзерОкт. 11, 2018, 14:00

Якщо ви є білі, живете в Сполучених Штатах, а далекий родич завантажив свою ДНК у загальнодоступну базу даних про предки, є хороший шанс, що інтернет-суту може визначити вас із зразка ДНК, який ви десь залишили. Це висновок нового дослідження, яке виявляє, що, поєднуючи анонімний зразок ДНК з базовою інформацією, наприклад, хтось грубого віку, дослідники могли звузити особистість особи менше 20 осіб починаючи з бази даних ДНК у 1, 3 мільйона осіб.

Такий пошук потенційно може дозволити ідентифікувати близько 60% білих американців із зразка ДНК, навіть якщо вони ніколи не надавали власну ДНК в базу даних про предки. За кілька років це справді буде всім, - каже керівник дослідження Янів Ерліх, обчислювальний генетик Колумбійського університету.

Дослідження було спричинене квітневим арештом ймовірного вбивства штату Голден, штату Каліфорнія, якого звинувачували у серії десятирічних згвалтувань та вбивств. Для того, щоб знайти його та ще більше десятка інших підозрюваних у злочинах з тих пір, правоохоронні органи вперше перевіряють ДНК-зразок місця злочину, на якому можуть бути старі кров, волосся чи сперма, для сотень тисяч маркерів ДНК. S підписи вздовж геному, які різняться у людей, але особистість яких у багатьох випадках поділяється з кровними родичами. Потім вони завантажують дані ДНК у GEDmatch, безкоштовну онлайн-базу даних, де кожен може поділитися своїми даними з компаній, що випробовують ДНК споживачів, таких як 23andMe та Ancestry.com для пошуку родичів, які подали свою ДНК. Шукаючи майже 1 мільйон профілів GEDMatch, було виявлено декількох родичів, які були еквівалентом третіх двоюрідних братів ДНК на місці злочину, пов’язаних із вбивцею Golden State. Інші відомості, такі як генеалогічні записи, приблизний вік та місця злочину, дозволили сюїтам пробувати на одній людині.

Генетики швидко міркували, що цей підхід міг визначити багатьох людей з невідомої послідовності ДНК. Але, щоб кількісно визначити, скільки саме людей, Ерліх та його колеги детальніше ознайомилися з базою даних MyHeritage, яка містить 1, 28 мільйона профілів ДНК людей, які переглядають історію їх сімейного життя. (Ерліх - головний науковий співробітник компанії, що займається випробуванням ДНК.) Якщо ви живете в Сполучених Штатах і є європейським походженням, там 60 відсотків шансів на те, що у цій базі є третій двоюрідний брат або близький родич, команда прогнозувала . Їх успішність була схожа, коли вони шукали 30 випадкових профілів у GEDmatch. (Коефіцієнт падає до 40% для когось із субсахарських африканських родин у базі даних MyHeritage.)

Якщо припустити, що у вас є родич в одній із цих баз даних, які шанси поліція зможе знайти вас із невстановленого зразка ДНК, як вони зловили передбачуваного вбивцю Голден Стейт? Щоб дізнатися це, Ерліх та його колеги поєднали інформацію бази даних MyHeritage із сімейними деревами та демографічними даними, такими як приблизний вік та ймовірне географічне розташування. В середньому, це дозволило їм використовувати гіпотетичну послідовність ДНК, щоб провести додому 17 "підозрюваних" з басейну з близько 850 людей, повідомляє команда сьогодні в Science.

GEDmatch, ймовірно, охоплює лише 0, 5% дорослого населення США, але мільйони американців користуються послугами тестування ДНК походження. Після того, як показник GEDmatch зросте до 2%, більше 90% людей європейського походження матимуть третього двоюрідного брата чи більш близького родича, і його можна знайти таким чином. "Дивно, наскільки мала база даних", - говорить генетик популяції Ноа Розенберг зі Стенфордського університету в Пало-Альто, штат Каліфорнія, який не був причетний до роботи.

У минулому році Розенберг та його колеги показали, що профіль у базі даних ДНК споживачів може бути узгоджений з профілем тієї самої людини у криміналістичних базах даних ДНК, хоча вони використовують інший менший набір маркерів ДНК. Сьогодні у Cell повідомляють, що понад 30% осіб у криміналістичних базах даних також можуть бути пов’язані з рідними братами, батьками чи дитиною у базі даних споживачів. У поєднанні двох типів баз даних може бути ще простіше знайти підозрюваного у зразку ДНК. Зв'язаний профіль ДНК споживача також може виявити фізичну зовнішність або медичну інформацію для злочинця або їх родичів, наприклад, гени для кольору очей або захворювання, навіть якщо криміналістичні бази даних не містять такої інформації. "З ними можна зробити більше, ніж було заявлено", - говорить Розенберг.

Хоча ці дослідження є заохочуючими новинами для розкриття злочинів, вони викликають занепокоєння щодо конфіденційності громадян, які дотримуються законів, говорить Ерліх. Одним із можливих рішень, запропонованих його командою, є те, що компанії-тестувачі ДНК споживачів цифровим чином зашифровують дані клієнта і GEDMatch дозволяє лише завантажувати ці зашифровані файли. Таким чином правоохоронний орган не міг би завантажувати дані про послідовність ДНК із власної лабораторії без співпраці родоначальників. (Поліція не може просто прикидатися замовником і надсилати зразки ДНК з місця злочину таким компаніям, як 23andMe, оскільки машини для секвенування компанії зазвичай не можуть обробляти мізерні, деградовані зразки ДНК.)

Ерліх також вважає, що посадовцям США потрібно переглянути федеральні правила, що захищають людей, які подають добровільну участь у дослідженнях. Нещодавно переглянута інструкція для дослідників біомедичних наук, яка називається загальним правилом, передбачає, що учасника дослідження не може бути легко ідентифікований за анонімним профілем ДНК. Але у своїй роботі команда Ерліха використовувала GEDMatch для ідентифікації жінки, яка була частиною дослідження, використовуючи її анонімізований профіль ДНК та дату народження, яка часто є загальнодоступною для дослідників.

Експерти генетичної політики сходяться на думці, що необхідні зміни в тому, як працюють генеалогічні бази даних та фірми з послідовності ДНК. Цифровий підпис може бути "частковим рішенням", - каже професорка права Наталі Рам з Університету Балтімора в Меріленді. Але всі учасники індустрії послідовності ДНК безпосередньо до споживача повинні були погодитися з цією схемою, зазначає вона. "Якщо ні, ми повернемося до квадратного".

Натомість вона та інші нещодавно в науці стверджували, що штати та Конгрес повинні приймати закони, що обмежують ситуації, коли правоохоронні органи можуть використовувати генеалогічні бази даних для пошуку підозрюваних. Це може бути розумним для справи про вбивство, але не для дрібного злочину, каже Рам. "Важливий пошук правильного балансу".