Todos mienten: lo que Internet y Big Data dicen de nosotros

El analista explora el poder de este suero de la verdad digital y su potencial más profundo: el de revelar sesgos profundamente arraigados en nosotros, información que podemos usar para cambiar nuestra cultura y las preguntas que tenemos miedo de preguntar (Shutterstock)

Nos guste o no, los datos almacenados en la red juegan un papel cada vez más importante en nuestras vidas. Las empresas tienen equipos con la tarea exclusiva de analizarlos y los inversores apuestan cada vez más a las empresas que pueden almacenarlos. En las páginas que visitamos, en reuniones de negocios, en los pasillos de las oficinas o en la mesa del hogar, los datos a gran escala estás en todos lados.

Todos mentimos, al parecer, todo el tiempo: a nuestros amigos, familiares, conocidos, jefes, compañeros de trabajo; y hasta -y especialmente- a nosotros mismos. Hay una instancia, sin embargo, en la que somos más trasparentes, y decimos algo más parecido a la verdad, y es en línea con nuestro verdadero ser: cuando estamos a solas con una computadora o un celular. Analizar qué buscan las personas en Internet permite saber cuáles son sus preferencias y sus preocupaciones, con mayor fidelidad que los resultados que pueden aportar las encuestas.

Esta asombrosa cantidad de información, sin precedentes en la historia, puede decirnos mucho sobre quiénes somos: los temores, los deseos y los comportamientos que nos impulsan, y las decisiones conscientes e inconscientes que tomamos. De lo profundo a lo mundano, podemos obtener a partir de ella un asombroso conocimiento sobre la psique humana que hace menos de veinte años parecía insondable.

Con esta premisa, el economista, filósofo y científico de datos Seth Stephens Davidowitz publicó lo que muchos consideran el libro del año de no ficción: Todo el mundo miente. El ex científico de datos de Google con un doctorado en economía de Harvard asegura que los grandes datos están proporcionando una visión sin precedentes de la condición humana. Y respalda su argumento bombardeándonos con estudios de casos, extraídos en gran medida de la Santísima Trinidad de los datos de Internet: Google, Facebook y PornHub.

La gran cantidad de información que cada individuo deja sobre sí mismo en la red puede ser utilizada por las empresas o por los gobiernos con fines que aún no terminamos de conocer y para los que, casi en ningún caso, brindamos autorización (Shutterstock)
La gran cantidad de información que cada individuo deja sobre sí mismo en la red puede ser utilizada por las empresas o por los gobiernos con fines que aún no terminamos de conocer y para los que, casi en ningún caso, brindamos autorización (Shutterstock)

Davidowitz explora y analiza los datos que arrojan las búsquedas en ese “confesionario virtual” y cómo éstas revelan mucha información sobre dudas, temores, deseos y obsesiones que públicamente pueden considerarse vergonzantes y, sin embargo, son información valiosa que funciona como una especie de subconsciente colectivo. La gran cantidad de información que cada individuo deja sobre sí mismo en la red puede ser utilizada por las empresas o por los gobiernos con fines que aún no terminamos de conocer y para los que, casi en ningún caso, brindamos autorización.

Aun así, rescata el valor del “sentido común”, las fuentes de datos y la información tradicional. Sabe, como buen filósofo y economista, que aún cuando el avance del desarrollo de los algoritmos pueda predecir ciertos fenómenos, siempre hay un quantum de incertidumbre en las mejores predicciones. Seth se reserva parte de su trabajo a las cuestiones éticas y la legitimidad moral en el uso de datos.

“Los datos de búsquedas de Google no son solo nuevos; son honestos. En la era pre-digital, las personas ocultaban sus pensamientos embarazosos. En la era digital, todavía los esconden de otras personas, pero no de Internet y de sitios particulares como Google y PornHub, que protegen su anonimato. Estos sitios funcionan como una especie de suero de la verdad digital. Big Data nos permite finalmente ver lo que la gente realmente quiere y realmente hace, no lo que dicen que quieren y dicen que hacen. Proporcionar datos honestos es uno de los poderes de Big Data”, asevera el especialista.

Para el científico social, Big Data tiene cuatro virtudes centrales. En primer lugar, es un “suero de la verdad digital”. En segundo lugar, ofrece los medios para ejecutar experimentos controlados aleatorios a gran escala, que generalmente son extremadamente costosos. En tercer lugar, la gran cantidad de datos nos permite acercarnos con precisión a pequeños subconjuntos de personas de una manera que antes era imposible. Y finalmente, proporciona nuevos tipos de datos.

El término Big Data describe el gran volumen de datos – estructurados y no estructurados – que inundan la red (Shutterstock)
El término Big Data describe el gran volumen de datos – estructurados y no estructurados – que inundan la red (Shutterstock)

Luego de recibirse como economista y motivado por su interés en torno al análisis crítico de datos, Davidowitz realizó un Máster en Filosofía en la Universidad de Stanford y trabajó como cientista de datos en Google, donde contribuyó al desarrollo de Google Trends. Actualmente, es escritor y editor del New York Times, y profesor invitado de varias universidades norteamericanas de la Ivy League. Su best seller Todos Mienten, prologado por el lingüista Steven Pinker, ha sido traducido a múltiples idiomas, es récord de ventas y ha recibido dos de los mayores premios del mercado del libro: PBS NewsHour Book of the Year y Economist Book of the Year.

Davidowitz trabajó con datos en las dos últimas elecciones estadounidenses: analizando el triunfo de Obama -y las variables del racismo- y prediciendo el triunfo de Trump contra todos los sondeos que daban la victoria a Hillary Clinton. Su trabajo se basó en la ciencia de datos y en el análisis de las búsquedas que hicieron los usuarios de Google de términos racistas y otras palabras xenófobas afines al discurso de Donald Trump. La clave de su estudio radicó en entender cómo en privado las personas revelan gran parte de sus verdaderos intereses y motivaciones; aquellos que más difícilmente hacen públicos. Es decir, que una parte importante de los encuestados mintieron en los sondeos para no admitir ante un desconocido los prejuicios raciales y misóginos a los que sí daban rienda suelta en Internet.

– ¿Por qué el Big Data es tan poderoso?

– La gente miente sobre la cantidad de tragos que tomaron camino a casa. Mienten sobre la frecuencia con la que van al gimnasio, sobre cuánto costaron esos zapatos nuevos o si leen libros o no. Dicen que están enfermos cuando no lo están. Dicen que estarán en contacto cuando en realidad no lo harán. Dicen que te aman cuando no lo hacen. Dicen que son felices mientras no lo son. Dicen que les gustan las mujeres cuando realmente les gustan los hombres. La gente le miente a los amigos. Mienten a los jefes. Mienten a los niños. Mienten a los padres. Mienten a los médicos. Mienten a los maridos. Mienten a las esposas. Se mienten a sí mismos. Y seguro que mienten a las encuestas.

La razón por la que Google y otros recolectores de Big Data pueden ser tan poderosos es porque la gente es realmente honesta con ellos. Dicen y revelan cosas cosas a Google y a los sitios web que podrían no contarle a nadie más. Ni a sus amigos, ni a sus familiares y ni siquiera en las famosas encuestas anónimas. La idea de que las personas tienden a ser sinceras en ellas es errónea. No dicen lo que realmente están pensando, lo que van a hacer y ni siquiera por qué hacen las cosas que hacen, sino que responden lo que los haga quedar bien. Entonces, cuando se pregunta a la gente si van a votar en las próximas elecciones, la mayoría dice que sí; si les preguntás si son racistas, dirán “por supuesto que no” y si les preguntas si son infieles de seguro dirán que no. Entonces, una y otra vez, las personas no necesariamente dicen lo que realmente piensan o hacen. Forman sus respuestas de una manera socialmente aceptable.

Los datos que respectan a la pornografía: una revelación al menos un tanto freudiana

El especialista asegura que las búsquedas de hábitos de pornografía en Internet son probablemente “el desarrollo más importante en nuestra capacidad de comprender la sexualidad humana”. Y que entregan datos que Schopenhauer, Nietzsche, Freud y Foucault hubieran pagado por conseguir (Shutterstock)
El especialista asegura que las búsquedas de hábitos de pornografía en Internet son probablemente “el desarrollo más importante en nuestra capacidad de comprender la sexualidad humana”. Y que entregan datos que Schopenhauer, Nietzsche, Freud y Foucault hubieran pagado por conseguir (Shutterstock)

La primera fuente de Davidowitz, cuando se estableció como científico de datos, fue Google Trends, que registra la frecuencia relativa de búsquedas particulares en diferentes lugares en diferentes momentos. Pronto agregó a la lista Google Adwords, que registra el número real de búsquedas. Luego pasó a otros campos: Wikipedia, Facebook y PornHub, uno de los sitios pornográficos más grandes del mundo.

Cuando tuvo acceso por primera vez a los datos de PornHub, el experto encontró una revelación que le pareció al menos un tanto freudiana. De hecho, asegura que se trata de una de las cosas más sorprendentes que ha encontrado hasta ahora durante sus investigaciones de datos: una cantidad sorprendente de personas que visitan sitios pornográficos convencionales lo hacen buscando representaciones de incesto.

De las cien principales búsquedas de hombres, dieciséis buscaban videos con temas de incesto. La mayor parte de ellas incluían escenas de madres e hijos. ¿Y las mujeres? Nueve de las cien búsquedas principales de mujeres en PornHub eran para videos con temas de incesto, y presentaban imágenes similares. Así, la pluralidad de búsquedas incestuosas hechas por mujeres eran escenas de padres e hijas. “No es difícil localizar en estos datos al menos un leve eco del complejo edípico de Freud. Él planteó la hipótesis de un deseo casi universal en la infancia, que luego se reprime, para la participación sexual con padres del sexo opuesto”, advierte Davidowitz.

Entonces, la afirmación general de Freud de que la sexualidad puede ser moldeada por las experiencias de la infancia está respaldada en parte de los datos de Google y PornHub, lo que revela que los hombres, al menos, conservan una cantidad excesiva de fantasías relacionadas con la infancia. Además, el porno de dibujos animados (escenas de sexo explícitas animadas con personajes de programas populares entre los adolescentes) demostró haber alcanzado un alto grado de popularidad. “Los hombres de entre 18 y 24 años -asevera- buscan con mayor frecuencia a las mujeres que son niñeras. Al igual que los hombres de 25 a 64 años y hombres mayores de 65 años. Y para los hombres en cada grupo de edad, la maestra y la animadora están entre los cuatro primeros. Claramente, los primeros años de vida parecen desempeñar un papel descomunal en las fantasías adultas de los hombres”.

Los tics pueden generar daños y aislar de la vida social (Shutterstock)
Los tics pueden generar daños y aislar de la vida social (Shutterstock)

– ¿Por qué diría que Internet está separando a las personas?

– El suero de la verdad digital ha revelado un interés permanente en juzgar a las personas según su apariencia; la existencia continua de millones de hombres gay que no “salen del closet”; un porcentaje significativo de mujeres que fantasean con la violación; un ánimo generalizado contra los afroamericanos; una crisis oculta de abuso infantil; y un estallido de ira islamofóbica violenta que solo empeoró cuando los gobiernos piden tolerancia.

Da miedo cuánta información existe sobre las personas gracias a Internet y mucha de esta información nunca desaparece. En las manos equivocadas esto podría ser increíblemente peligroso, por lo que definitivamente estoy preocupado por el gobierno chino o ruso y cómo estos pueden usar los datos y la información. Hasta cierto punto, cualquiera que haya tenido acceso a cualquiera de las enormes compañías de Internet podrá extorsionar a casi cualquier persona, por lo que existe la idea de que los rusos acceden a los videos sexuales de políticos opositores para amenazarlos y ante cualquier situación divulgar esa información. Podemos imaginarnos que esto suceda a una escala mucho mayor gracias a Internet, donde creo que casi cualquier ser humano tiene algo vergonzoso, algo que no querrían que todo el mundo supiera. Cualquiera que tenga acceso al comportamiento de otra persona tiene un poder aterrador sobre ella.

SEGUÍ LEYENDO:

Las 25 personas más influyentes de internet según Time

Las tendencias en Internet y las nuevas estrategias para negocios online: lo nuevo del e-Commerce Day de Buenos Aires

Crearon un nuevo celular para estar “desconectado” de las redes sociales