Creado un algoritmo que protege la información personal de los pacientes al tiempo que preserva la utilidad de los datos para estudios médicos a gran escala

Los investigadores de la Universidad de Vanderbilt han creado un algoritmo diseñado para proteger la privacidad de los pacientes y, al mismo tiempo, mantener la capacidad de los investigadores para analizar grandes cantidades de datos genéticos y clínicos, y así encontrar vínculos entre las enfermedades y los genes específicos, o bien para entender por qué los pacientes pueden responder de manera tan diferente a los tratamientos.

Los historiales médicos guardan todo tipo de información sobre los pacientes, desde la edad al género, pasando por el historial médico familiar y los diagnósticos actuales. La creciente disponibilidad de los historiales médicos electrónicos hace más fácil la agrupación de los archivos de los pacientes en enormes bases de datos, a las que pueden acceder los investigadores para tratar de encontrar asociaciones entre genes y enfermedades médicas–un paso importante dentro del camino hacia la medicina personalizada. Si bien los registros del paciente en estas bases de datos son “anónimos”, es decir, despojados de identificadores tales como el nombre y la dirección, aún así contienen códigos numéricos conocidos como códigos de diagnóstico o códigos CIE, que representan todas las enfermedades que ha logrado detectar un médico.

El problema reside en que no es tan difícil seguir la pista a un conjunto específico de códigos e identificar a una persona. Para resolver este problema, el equipo de Vanderbilt diseñó un algoritmo capaz de buscar en una base de datos las combinaciones de códigos de diagnóstico que distinguen a un paciente de otro. A continuación, el algoritmo sustituye una versión más general de los códigos–por ejemplo, la osteoporosis postmenopáusica podría convertirse en simplemente osteoporosis–para asegurarse de que el registro alterado de cada paciente no puede ser distinguido entre un cierto número de otros pacientes. Más tarde, los investigadores pudieron acceder a esta base de datos paralela, sin identificación, y llevar a cabo sus estudios de asociación genética.

Aunque el nuevo método tiene sus limitaciones, los investigadores desean combinar su algoritmo protector de código clínico con otros mecanismos de protección de seguridad ya existentes, como por ejemplo la protección de la información demográfica, y así lograr mantener los datos del paciente lo más seguros posible.

Fuente: www.technologyreview.com