arXiv blog

Twitter Firehose Revela Como Nova Iorque Dorme 3 Horas Mais Tarde aos Domingos

O fluxo de atividade geolocalizada do Twitter é um "microscópio social" que revela o batimento de uma cidade, dizem estudiosos da complexidade.

The Physics arXiv Blog 12/11/2014

Na canção tema do filme "New York, New York", Liza Minnelli descreve a famosa cidade de Nova Iorque como a cidade que nunca dorme. Agora, os dados do Twitter Firehose mostram como.

Urbano Franca e alguns colegas do New England Complex Systems Institute em Cambridge coletaram tweets geolocalizados da região em torno da cidade a cada hora entre agosto e dezembro de 2013. Eles, então, dividiram a região em 90.000 células e contaram o número de tweets produzidos em cada célula. Por fim, eles compararam a atividade por hora em cada célula contra sua média semanal.

Os resultados fornecem uma visão fascinante sobre o coração social da cidade. Franca e col. dizem que os dados mostram claramente o ciclo de sono do nova iorquino, seus trajetos urbanos e as áreas de atividade especialmente elevada, tais como aeroportos nas noites de sexta-feira.

O ciclo de atividade de um dia de semana é especialmente claro, refletindo períodos em que as pessoas têm mais tempo para twittar. No início da manhã, as pessoas tendem a twittar de suas casas nos subúrbios, esta atividade muda para Manhattan após a chegada ao trabalho e há picos na hora do almoço. A atividade nos subúrbios sobe novamente à noite até cerca de 22:00 e começa a diminuir à medida que as pessoas vão se deitar. A atividade em Manhattan continua durante toda a noite, enquanto o restante da cidade dorme.

Curiosamente, o ciclo de sono do final de semana é deslocado em cerca de três horas. Há significativamente mais atividade na noite de sábado e madrugada de domingo que é distribuída por todos os centros urbanos da cidade. O pico de atividade da manhã seguinte, então, ocorre às 10h, cerca de três horas mais tarde do que o habitual.

Tardes de domingo mostram um padrão único de atividade que é amplamente distribuído entre as comunidades residenciais e alguns locais específicos, como a Estátua da Liberdade. "Um pico de atividade é observado no Central Park durante o domingo que não é observado nos outros dias da semana", diz Franca e col.

Curiosamente, os dados também mostram como os indivíduos com taxas especialmente elevadas de atividade no Twitter podem dominar a atividade em seus bairros também.

A equipe produziu um vídeo dos resultados que mostra o fluxo e refluxo de tweets em Nova York e suas áreas residenciais durante a semana.

Isso é uma aplicação interessante dos dados do Twitter para revelar as dinâmicas sociais de uma das maiores cidades do mundo. Este tipo de visualização tem o potencial de ajudar os planejadores da cidade a entender melhor suas tarefas.

Pela primeira vez, esses planejadores têm um "microscópio social", que mostra a interação entre os moradores da cidade e o meio ambiente em que vivem em detalhe. Além de mudar a letra de músicas que falam sobre a cidade, outras formas de eles usarem essas informações ainda não estão claras; sugestões na seção de comentários, por favor.

Ref: arxiv.org/abs/1411.0722 Visualizing The "Heartbeat" Of A City With Tweets

Inspirados pela Wikipedia, Cientistas Sociais Criam uma Revolução na Pesquisas on-line

A maioria das informações presentes na Wikipedia vem de um pequeno número de usuários. Agora, cientistas sociais estão coletando dados de maneira semelhante, permitindo que participantes desenhem pesquisas à medida que contribuem.

The Physics arXiv Blog 10/10/2014

Coletar dados sobre preferências e atividades humanas é a base de muita pesquisa em ciências sociais. Mas a melhor forma de reunir esses dados tem sido objeto de debate feroz.

Cientistas sociais têm essencialmente duas opções. Por um lado, há pesquisas de opinião pública com base em um conjunto de perguntas de múltipla escolha - a chamada abordagem fechada. Por outro lado, há abordagens abertas na forma de entrevistas de âmbito livres em que os entrevistados ficam livres para falar o que pensam. Existem claramente vantagens e desvantagens importantes para cada método.

Hoje, Matthew Salganik da Universidade de Princeton, em Nova Jersey, e Karen Levy na Universidade de Nova Iorque apresentaram uma nova forma de coletar dados inspirada por uma nova geração de sistemas de agregação de informações como a Wikipedia. "Assim como Wikipedia que evolui ao longo do tempo com base nas contribuições dos participantes, vemos uma pesquisa em evolução impulsionada pelas contribuições dos participantes", dizem eles.

Eles dizem que a nova abordagem pode produzir insights que seriam difíceis de obter com outros métodos. Mas também apresenta desafios para os cientistas sociais, em especial quando se trata de analisar os dados coletados desta forma.

Projetos como Wikipedia são o resultado de conteúdo gerado por usuários em enorme escala. A dúvida de Salganik e Levy é se as pesquisas também poderiam ser construídas por participantes, pelo menos em parte.

Para descobrir isso, esses caras desenvolveram um novo tipo de mecanismo de coleta de dados que eles chamam de pesquisa wiki. Começou com um conjunto de perguntas base, mas permite que os entrevistados acrescentem suas próprias perguntas à medida que a pesquisa evolui.

A pesquisa wiki tem uma forma particular em que os entrevistados são convidados a escolher entre duas opções: eles preferem Item A ou Item B, por exemplo. Mas na verdade, eles também podem adicionar um novo item que será apresentado aos futuros participantes. Assim, à medida que o tempo passa, o número de opções aumenta à medida que os entrevistados sugerem suas próprias ideias.

Este tipo de pesquisa tem diversas vantagens. Salganik e Levy salientam que este formato de pesquisa permite que os participantes respondam com tantas opções quanto quiserem. Eles chamam isso de ganância de propriedade.

Este tipo de pesquisa também permite que os participantes contribuam com novos itens sempre que quiserem e, assim, é exclusivamente colaborativo. Por fim, as respostas apresentadas a novos participantes podem ser selecionadas de forma a maximiza o aprendizado com base nas respostas anteriores. então uma pesquisa wiki pode se adaptar à medida que evolui.

Para testar a ideia, Salganik e Levy criaram um site gratuito chamado www.allourideas.org em que qualquer pessoa pode criar uma pesquisa wiki e reunir entrevistados de um público-alvo incentivado a participar. Desde 2010, o site já recebeu cerca de 5.000 pesquisas wiki que incluíam 200.000 itens e receberam 5 milhões de respostas.

Salganik e Levy discutiram em detalhes o exemplo de uma pesquisa realizada pelo Escritório de Planejamento a Longo Prazo e Sustentabilidade gerenciado pelo prefeito de Nova York. Esta organização quis entender as ideias dos moradores sobre o plano de sustentabilidade da cidade e integrar quaisquer novos pensamentos.

A prefeitura começou com uma lista de 25 itens que ele pediu às pessoas para comparar aos pares, ao mesmo tempo, incentivando os participantes a adicionar suas próprias ideias. Por exemplo, as pessoas foram convidadas a escolher entre "pátios escolares abertos por toda a cidade como parques públicos" e "aumento localizado do plantio de árvores em bairros com alto número de pessoas com asma".

Durante quatro meses, 1.436 pessoas contribuíram com mais de 30 mil respostas e 464 novas ideias para a pesquisa. Ao final da pesquisa, oito das 10 ideias com melhor pontuação tinham sido fornecidas pelos próprios entrevistados.

Essas ideias, incluíram ideias que pouco provavelmente teriam surgido através de outros métodos de coleta de dados, como "Manter a água de Nova Iorque potável, proibindo fracking na bacia hidrográfica de NYC" e "ligar navios à rede elétrica, para que não fiquem ociosos nos portos - reduzindo emissões em volume equivalente ao emitido por 12.000 carros a cada navio conectado".

Salganik e Levy rapidamente notam que seu método exige muito mais pesquisa.

Em especial, eles precisam entender melhor a consistência e a validade das respostas que geram. Isso pode ser feito comparando os resultados com os de outras formas de coleta de dados.

Além disso, a análise dos dados oriundas das pesquisas wiki ainda é um tipo de experiência estatística e são um desafio significativo para a comunidade estatística que busca formas mais eficientes de extrair informações usando esse tipo de processo.

Essa é uma nova abordagem interessante que permite a coleta de dados que seriam difíceis de obter por outros métodos. Em especial, permite que dados sejam reunidos de uma forma que reflita a distribuição normal já bem conhecida das pesquisas.

Por exemplo, na Wikipedia a maioria das informações é criada por um pequeno número de editores. "Se a Wikipedia fosse autorizar somente 10 edições por editor - semelhante a uma pesquisa que pede aos participantes que escolham apenas uma opção - excluiria cerca de 95% das edições que recebe", dizem Salganik e Levy.

É claro que esse tipo de preconceito deve ser contabilizado quando se trata da análise de dados. E é aí que está o real desafio. É hora de os estatísticos ficarem ocupados.

Mais Evidências de que as Redes Sociais On-line Têm Efeitos Negativos

Um estudo com 50 mil pessoas na Itália conclui que as redes sociais têm um impacto negativo significativo sobre o bem-estar individual.

The Physics arXiv Blog 29/08/2014

As redes sociais on-line têm permeado nossas vidas, com consequências de longo alcance. Muitas pessoas a usam para estar próximo de amigos e familiares em partes distantes do mundo, para fazer conexões que levam suas carreiras para frente e para explorar e visualizar não só sua própria rede de amigos, mas nas redes de seus amigos, família e colegas.

Mas há cada vez mais evidências de que o impacto das redes sociais não é só bom, nem mesmo só benigno. Uma série de estudos já começou a encontrar evidências de que as redes sociais podem ter efeitos prejudiciais. Esta questão é muito debatida, muitas vezes com resultados conflitantes e, geralmente, utilizando grupos limitados de indivíduos, como estudantes de graduação.

Hoje, Fabio Sabatini na Universidade Sapienza de Roma, na Itália e Francesco Sarracino da STATEC de Luxemburgo tentaram isolar os fatores envolvidos nesta questão polêmica processando os dados obtidos através de uma pesquisa com cerca de 50.000 pessoas na Itália, feita ao longo de 2010 e 2011. A pesquisa mede especificamente o bem-estar subjetivo e também reúne informações detalhadas sobre a forma como cada pessoa usa a Internet.

A pergunta que Sabatini e Sarracino tentam responder é se o uso de redes sociais reduz o bem-estar subjetivo e se sim, como.

O banco de dados de Sabatini e Sarracino é chamado de "Estudo Genérico em Famílias", uma pesquisa feita em cerca de 24.000 famílias italianas, o que corresponde a 50.000 indivíduos, realizado pelo Instituto Nacional de Estatística italiano a cada ano. Eles usaram os dados coletados entre 2010 e 2011, o ponto mais importante sobre a pesquisa é a seu tamanho e representatividade a nível nacional (ao contrário de outros grupos limitados a alunos de graduação).

O estudo pergunta especificamente "Quão satisfeito você está com sua vida, no geral, hoje em dia?", exigindo uma resposta entre extremamente insatisfeito (0) e extremamente satisfeitos (10). Isto fornece uma boa medida do bem-estar subjetivo.

A pesquisa também faz outras perguntas detalhadas, como a forma como as pessoas se encontram com amigos e se eles acham que as pessoas são confiáveis. Também perguntou sobre o uso de redes sociais on-line como o Facebook e Twitter.

Isso permitiu que Sabatini e Sarracino estudassem a correlação entre o bem-estar subjetivo e outros fatores da vida, especialmente o uso de redes sociais. Como estatísticos, eles foram especialmente cuidadosos em excluir correlações falsas que pudessem ser explicadas por fatores como viés e endogeneidade, onde um parâmetro aparentemente independente está, na verdade, relacionado a um fator não observado desprezado como erro.

Eles descobriram, por exemplo, que as interações pessoais e a confiança que uma pessoa tem na outra estão fortemente correlacionadas com o bem-estar de uma forma positiva. Em outras palavras, se você tende a confiar mais nas pessoas e ter mais interações pessoais, você provavelmente dará uma nota melhor para o seu bem-estar.

Mas, é claro, as interações em redes sociais on-line não são feitas pessoalmente e isso pode afetar a confiança que você tem nas pessoas on-line. É essa perda de confiança que pode afetar o bem-estar subjetivo em vez da própria interação on-line.

Sabatini e Sarracino desafiam estatisticamente esse fato. "Nós encontramos que a rede social on-line desempenha um papel positivo no bem-estar subjetivo através do seu impacto sobre as interações físicas, ao passo que [o uso de] sites de redes sociais está associado a menor confiança social", dizem eles. "O efeito global da rede no bem-estar individual é significativamente negativo", concluem.

Este é um resultado importante, pois é a primeira vez que o papel das redes on-line foi abordado em uma amostra tão grande e representativa e a nível nacional.

Sabatini e Sarracino destacam especialmente o papel da discriminação e incitação ao ódio em mídias sociais que dizem ter um papel significativo na confiança e bem-estar. Melhor moderação poderia melhorar significativamente o bem-estar das pessoas que usam redes sociais, eles concluem.

Facebook, Twitter e outros tomem nota.

Ref: arxiv.org/abs/1408.3550 : Online Networks and Subjective Well-Being

Publicidade

Vídeo

Inovadores com menos de 35 anos Brasil

Mais Vídeos

Informes Especiais

Uma Cura para os Gastos com Saúde

Os gastos com a saúde estão fora de controle. E a inovação em medicamentos, testes e tratamentos é o motivo. Mas e se a tecnologia pudesse ser uma forma de poupar dinheiro ao invés de gastá-lo?

Ganhando Com Dispositivos Móveis

Publicidade
Publicidade