Jornadas de Sociología


PONENCIA 1358 | Twitter: la construcción de un corpus de trabajo

MAIL DE CONTACTO:
juanpablosokil@gmail.com

Autores:
David Taraborrelli(IIGG/FSOC) - boedo28@gmail.com
Juan Pablo Sokil(Universidad Buenos Aires) - juanpablosokil@gmail.com

Resumen de la Ponencia

Twitter es una de las principales fuentes de información utilizadas para el análisis de redes sociales y discursos. Sin embargo, pocas veces se reflexiona sobre la calidad y características de los datos extraídos de esta red social. Por lo tanto, el objetivo de este trabajo es indagar y caracterizar las muestras de contenido que ofrece Twitter en su interfaz APIs. La recolección de datos en Twitter se puede realizar de dos formas: en tiempo real, donde se obtiene una muestra aleatoria de alrededor del 1% de los tweets y hacia atrás, donde la muestra es aleatoria y tiene un límite temporal (7 días) y otro cuantitativo (18 mil tweets cada 15 minutos). Si bien las muestras garantizan su aleatoriedad, no está explicitado en la documentación cuán representativas son. Si distintos investigadores estudian el mismo fenómeno ¿obtienen resultados similares? ¿Es posible definir y seguir una serie de criterios metodológicos que puedan garantizarnos que esto suceda? Para responder a estas preguntas diseñamos un experimento en el que seguimos 5 eventos acotados en el tiempo, con una duración de 4 horas, utilizando 4 cuentas developer twitter, cada una con una dirección IP distinta y utilizando las dos estrategias de recolección: en tiempo real y hacía atrás. Sobre estos datos analizaremos las similitudes y diferencias, tratando de identificar patrones que permitan definir criterios metodológicos para la adecuada construcción de un corpus de trabajo.





Ver Ponencia