Las palabras más populares utilizadas en las redes sociales

¿Alguna vez te has preguntado sobre el lenguaje que se utiliza en las Redes Sociales? ¿O las palabras que usamos se basan en nuestros rasgos de personalidad? Si tu respuesta es sí, estás de enhorabuena.

Fondo

El Centro de Psicología Positiva con sede en la Universidad de Pensilvania creó lo que se conoce como el Proyecto de Bienestar Mundial (WWBP). Este increíble proyecto está forjando técnicas científicas midiendo el bienestar psicológico y la salud física a partir del análisis del lenguaje en las redes sociales. Los informáticos, psicólogos y estadísticos más brillantes están analizando los procesos psicosociales que afectan la salud y la felicidad, y están explorando el potencial para reemplazar los costosos métodos de encuesta. En 2013, WWBP publicó un estudio titulado “Personalidad, género y edad en el lenguaje de las redes sociales: el enfoque de vocabulario abierto”. En uno de los estudios más grandes hasta la fecha, WWBP analizó más de 700 millones de palabras, frases e instancias de temas recopilados de los mensajes de Facebook de 75 000 voluntarios. Para analizar los mensajes, utilizaron dos métodos diferentes para encontrar atributos demográficos y psicológicos:

  • Análisis diferencial del lenguaje (DLA): un método diseñado por WWBP para identificar las características más distintivas del lenguaje de cualquier atributo dado.
  • Investigación lingüística y conteo de palabras (LIWC): una herramienta popular utilizada en psicología para encontrar formas en que las personas usan palabras en su vida diaria. Esto puede proporcionar información valiosa sobre sus creencias, miedos, patrones de pensamiento, relaciones sociales y personalidades.

En este estudio en particular, WWBP también hizo que los voluntarios realizaran pruebas estándar de personalidad (el Modelo de los 5 grandes factores) para determinar las palabras utilizadas en ciertos rasgos de personalidad. Combinando todo esto, pudieron vincular el lenguaje de las redes sociales de personalidad, género y edad con un 91,9 % de precisión. Ahora ensuciémonos las manos y echemos un vistazo a cómo recopilaron las actualizaciones de estado de Facebook y formularon sus gráficos de visualización.

Los datos

El conjunto de datos completo constaba de aproximadamente 19 millones de actualizaciones de estado de Facebook escritas por todos los participantes. El equipo de WWBP restringió su análisis a aquellos usuarios de Facebook que cumplieron con 4 criterios determinados:

  • Deben indicar el inglés como idioma principal.
  • Haber escrito al menos 1000 palabras en sus actualizaciones de estado
  • Ser menor de 65 años
  • Indique el sexo (masculino y femenino) y la edad

Idioma de género:

Las características del lenguaje femenino se muestran en la parte superior y las características del lenguaje masculino a continuación. la stamaño de la palabra indica la fuerza de la correlación; el color indica la frecuencia relativa de uso. guiones bajos (_) conectar palabras de frases de varias palabras.

  • Hembras de este estudio (Arriba), usaron más palabras de emoción (p. ej., emocionado) y singulares en primera persona y mencionan más procesos psicológicos y sociales (p. ej., ‘te amo’ y ‘<3' – un corazón).
  • machos usó más malas palabras y referencias a objetos (p. ej., ‘xbox’, ‘black ops’, ‘desea que él’).

Idioma de edad:

Como puede ver en la Figura 3 anterior, hay cambios sutiles de temas que progresan de un grupo de edad al siguiente. Además, hay distinciones claras en palabras como el uso de jerga, emoticonos y lenguaje de Internet en el grupo de edad de 13 a 18 años. En el 23 a 29 grupo de edad, puedes ver un par Internet habla o temas de trabajo (por ejemplo, ‘en el trabajo’, ‘nuevo trabajo’). Vemos un escuela tema relacionado para 13 a 18 años (por ejemplo, ‘escuela’, ‘tarea’, ‘ugh’), mientras que vemos un colega tema relacionado para 19 a 22 años (por ejemplo, ‘semestre’, ‘universidad’, ‘registro’). A medida que avanza hacia el grupo de edad de 30 a 65 años, las palabras que se utilizan se centran más en la estabilidad emocional con la familia y los amigos (p. ej., ‘hija’, ‘mi hijo’, ‘mis hijos’ y ‘mis amigos de fb’). En general, verá una progresión de la escuela, la universidad, el trabajo y la familia cuando analice los temas principales en todos los grupos de edad.

Frecuencia estándar de temas y palabras según la edad:

En Figura 4Ael gráfico muestra la frecuencia relativa de los temas más selectivos para cada grupo de edad en función de la edad. Figura 4B refuerza esta hipótesis al presentar un patrón similar basado en otros temas sociales. Figura 4C muestra que el uso de ‘nosotros’ aumenta después de los 22 años, mientras que ‘yo’ disminuye. Esto definitivamente sugiere la creciente importancia de las amistades y las relaciones a medida que las personas envejecen.

Lenguaje de la personalidad:

Los investigadores indagaron en cómo coinciden nuestro lenguaje y nuestra personalidad. Analizaron las palabras utilizadas por los participantes y las organizaron en función de la personalidad de cada participante. Aquí hay un repaso rápido de los 5 factores de personalidad:

  • Extroversión: describe cómo interactúas con las personas.
  • Neuroticismo: es cómo lidias con las emociones
  • Amabilidad: es cómo te sientes hacia los demás.
  • Conciencia: describe qué tan organizado y confiable eres
  • Apertura: es cuando alguien es curioso y de mente abierta a nuevas experiencias y conocimientos.

Podemos ver en la parte superior izquierda que categorías relacionadas socialmente como fiesta temas emergen como una característica distintiva clave para extrovertidos. Además, los resultados sugieren que Introvertidos están interesados ​​en los medios japoneses (por ejemplo, ‘anime’, ‘manga’, ‘internet’ y emoticonos de estilo japonés: ˆ_ˆ). La parte inferior izquierda de la Figura 5 muestra que las personas Alto en Neuroticismo frases comúnmente mencionadas como ‘enfermo de’, ‘deprimido’ y ‘odio’. La parte inferior derecha muestra lenguaje relacionado con la estabilidad emocional (Bajo Neuroticismo). Bajo neurótico las personas escribieron sobre actividades sociales agradables que fomentan la armonía o crean un mayor equilibrio emocional, como ‘deportes’, ‘vacaciones’, ‘playa’, ‘iglesia’, ‘equipo’ y un tiempo familiar tema. En la Figura 6 a continuación (abajo a la derecha), las personas que muestran Baja Apertura use palabras abreviadas en su actualización de estado (por ejemplo, ‘2day’, ‘ur’, ‘every 1’). Personas que son Alta apertura (abajo a la izquierda) utilizan palabras creativas (por ejemplo, ‘arte’, ‘universo’, ‘música’, ‘escritura’ y ‘alma’). Puede que no resuene con esto, pero Baja conciencia personas (centro-izquierda) usan palabras muy explícitas en sus actualizaciones mientras que Alta conciencia las personas (centro-izquierda) usan frases (p. ej., ‘to work’, ‘ready for’ y ‘great day’). Como puedes ver, las plataformas de redes sociales como Facebook y Twitter son recursos muy favorables para el estudio de las personas; las actualizaciones de estado y los tweets son expresivos, personales y tienen contenido emocional. Recuerda algunas cosas:

  • Ese lenguaje, en general, es imparcial y son datos de comportamiento medibles.
  • El lenguaje de Facebook permite específicamente a los investigadores observar a las personas mientras presentan su verdadero yo al mundo en línea.

Método DLA

Figura 1

Como puede ver en la Figura 1 anterior, el DLA funciona de la siguiente manera: 1.) Extracción de características: Extracción de idioma por: (a) palabras y frases: una secuencia de 1 a 3 palabras que se encuentran en una cadena de texto, emoticones y dos o más palabras que corresponden a alguna forma convencional de decir las cosas. (b) temas: analiza automáticamente grandes colecciones de texto sin etiquetar. 2.) Análisis correlacional: el proceso de correlacionar las palabras con el género, la edad y la personalidad. Dado que encontraron miles de palabras significativamente correlacionadas, los gráficos de visualización fueron la clave para comprender su investigación (consulte la Fig. 2 a continuación).

fascinante verdad?