Por Bhaskar Chakravorti, Ajay Bhalla e Ravi Shankar Chaturvedi
Quem são os maiores geradores de dados? Com o uso de aplicativos de inteligência artificial alimentados por dados (que gerarão $13 trilhões em novas atividades na economia global até 2030, segundo projeções da McKinsey), uma nova ordem do mundo poderia ser definida, da mesma forma que a produção de petróleo tornou países potentes no século passado.
Enquanto a China e os Estados Unidos surgem como duas superpotências em IA, fontes de dados não podem se limitar a estarem concentradas em poucos locais, da mesma forma que acontece com uma economia movida pelo petróleo; dados precisam ser gerados em várias fontes e a utilização da IA virá de players inesperados. A nova ordem do mundo que está se formando tende a ser mais complexa do que uma simples estrutura bipolar, principalmente porque os dados são gerados numa velocidade difícil de imaginar.
Baseando-se no que foi feito ao mapear a evolução e a competitividade digitais em vários países do mundo, tentamos localizar os mais amplos grupos de dados úteis, o que é imprescindível para gerenciar os vários modelos de machine learning indispensáveis à IA. Para isso, é preciso saber distinguir o volume de dados brutos de um dado que chamamos de “número de dados bruto”. Para identificar os maiores geradores de dados brutos, sugerimos utilizar quatro critérios:
Volume: Volume absoluto de banda larga utilizada num país, como um representante dos dados brutos produzidos.
Utilização: Número de usuários da Internet como dado para a análise da ampliação de uso, necessidades e contextos.
Acessibilidade: Abertura institucional ao fluxo de dados como maneira de avaliar se os dados gerados num determinado país permitem o uso e a acessibilidade de vários pesquisadores de IA, bem como inovadores e aplicativos.
Complexidade: O consumo de volume de banda larga per capita, como dado para a melhoria e complexidade da atividade digital.
Há várias alterações a serem consideradas. Uma delas é o fato de sabermos que o caminho digital criado pelos computadores no mundo todo abre caminho para várias atividades, desde o envio de um SMS até a realização de uma operação financeira. Para possibilitar a comparação de bananas com bananas na esfera global, utilizamos a métrica de banda larga per capita para avaliar a amplitude e a complexidade (em alguns casos, simulando o uso da renda per capita como um dado para a melhoria como um todo).
Em seguida, há diferenças entre os países no que tange a maneira como dados pessoais são compartilhados entre agências e se há estruturas para a identidade digital que auxiliam na conexão do usuário a suas atividades digitais. Esses fatores institucionais poderiam fazer a diferença na maneira como os dados podem se agrupar e não podemos deixar essas diferenças de lado. Selecionamos os países que estão em nossa análise com base em alguns pontos: 1) Países que contribuem em massa para a economia digital mundial seja porque já estavam avançados na nossa avaliação anterior do índice de evolução digital, seja porque têm um momento significativo na sua atividade digital; 2) Países que mostram uma expansão territorial e um avanço na sua posição socioeconômica; e 3) Países que forneceram dados sólidos e embasamento para a realização da avaliação.
Por fim, devemos dar uma atenção especial à privacidade, pois ela é quem determina a acessibilidade. A privacidade é algo preocupante e as normas para a proteção de dados ajudam ou prejudicam a capacidade de atuação dos algoritmos de desenvolverem novas habilidades. Acreditamos que, para essa análise, uma estrutura que garante privacidade e proteção dos dados, bem como a abertura para a mobilidade deles, seja um benefício líquido e um contribuidor positivo para o desenvolvimento da AI em longo prazo. Como exemplo, vejamos o problema da detecção de fraude em transações financeiras. Aplicativos que atraem usuários de várias localizações e contextos de várias utilizações ajudam a estabelecer padrões de confiança e a identificar os riscos na segurança; tais aplicativos se beneficiam de sistemas que obedecem aos critérios de acessibilidade. Sendo assim, em médio prazo, sabemos que há países – a China sendo um exemplo preeminente – onde o compartilhamento de dados entre agências dos setores público e privado com pouquíssima mobilidade além da fronteira nacional podem burlar a privacidade e normas de abertura e, ainda assim geram uma vantagem temporária para o treinamento de algoritmos num “jardim murado”.
Considerando os dados, quais desses critérios devem ser usados para avaliar uma nova ordem do mundo? A acessibilidade deve permanecer como o critério principal. Se tivermos que considerar o ponto de vista de que o maior impacto da utilização da AI é aquele que atende o maior número de pessoas, o acesso aos dados é primordial. Num estudo recente sobre IA para o benefício do público em geral, McKinsey fala do acesso como uma das barreiras principais: dos 18 gargalos identificados por ele, seis estavam relacionados à disponibilidade, ao volume, à qualidade e à utilização de dados.
O gráfico abaixo mostra o que acontece quando os 30 países que analisamos foram mapeados com a utilização de dois dos critérios:
Legenda:
Nova ordem de dados que destaca abertura e evolução digital
Os melhores países em acessibilidade a dados e consumo de banda larga por usuários são, nitidamente, vencedores.
Vertical:
Pontuação de acessibilidade
Horizontal:
Consumo de banda larga por usuário da Internet in Terabytes (2017)
*O ponto da dados da UE abrange 12 países da EU e quase 81% da população
Fonte: Estudo feito pela Euromonitor, Cisco, ITU, Global Open Data Index/Open Government Partnership e CNIL data pela The Digital Planet Initiative da Fletcher School, Tufts University; e Mastercard
Enquanto os Estados Unidos se sobressaem nos três critérios – o que pode parecer contra intuitivo para a sabedoria estabelecida – a China operará com dificuldades caso a acessibilidade global de dados seja essencial para criar aplicativos de IA promissores no futuro. Se a UE (atualmente incluindo o Reino Unido) tivesse de agir em conjunto, ela é tida como o produtor principal que poderia competir com os Estados Unidos. Além disso, a China e os outros países do BRIC – Brasil, Índia e Rússia – poderiam surgir como competidores de dois níveis, em grande parte pela importância de dados brutos que geram; no entanto, eles também estariam deficitários em relação à acessibilidade.
Um grupo diferente de resultados pode surgir de países menores, como a Nova Zelândia ou aqueles que não são dependentes de economias maiores – como a Coreia do Sul – mas têm uma ampla abertura e mobilidade no tráfego de dados; esses países se beneficiariam de acordos de comércio de dados com outras nações “abertas” e poderiam, como resultado, superar suas limitações no que tange número de usuários ou consumo absoluto da banda larga no país. O formato que o acordo de comércio e de compartilhamento de dados deve ter ainda não foi estipulado; entretanto, é possível prever que esse acordo pode ser uma grande possibilidade, principalmente quando sabemos que o número de dados brutos tem tanto valor como qualquer outro produto livremente comercializado nos dias de hoje.
Sabemos que o rumo que o uso da IA de alto valor ainda está em ascensão. Há, também, o risco de a IA ser divulgada em demasia e ser mal interpretada, gerando frustrações no futuro. Contudo, é evidente que ela está sendo amplamente utilizada e ainda há espaço para crescimento. Nossa infraestrutura é bastante flexível para acomodar o fluxo de dados. Se utilizarmos um conjunto diferente de critérios – porém mais relevante para gerenciar a utilização da AI – iremos encontrar um outro cenário. O gráfico abaixo mostra uma possibilidade, considerando somente os itens complexidade e acessibilidade.
Legenda:
Nova ordem de dados que destaca o acesso a dados
Um impasse simplista entre EUA e a China abre caminho para um cenário mais detalhado quando você obtém o número de usuários da internet e a quantidade de banda larga que é utilizada.
Horizontal:
Consumo de banda larga em milhões de terabytes (2017)
Vertical:
Pontuação de acessibilidade
*O ponto indicador da UE engloba 12 países da EU e quase 81% da população.
Fonte: Fonte: Estudo feito pela Euromonitor, Cisco, ITU, Global Open Data Index/Open Government Partnership e CNIL data pela The Digital Planet Initiative da Fletcher School, Tufts University; e Mastercard.
Quando visualizado dessa maneira, há uma estrutura mais linear dessa “nova” ordem global de fluxo de dados. O alto consumo de banda larga per capita e países institucionalmente abertos (no canto superior direito do gráfico) aparecem claramente à frente. Talvez pessoas possam imaginar um cenário onde a alta complexidade e mobilidade do fluxo de dados no canto superior direito do gráfico abram caminho para uma “zona franca” de maior produção, onde países se beneficiam mutualmente, fazendo uso das reservas de dados um do outro.
E por fim, analisamos o cenário onde os quatro critérios devem ser levados em consideração. Se atribuirmos importâncias iguais a esses critérios, uma classificação de “novos” geradores de dados e uma nova ordem atualizada irão surgir.
Essa segmentação mostra onde os geradores de dados mais importantes estão localizados, com base numa série de suposições sobre o que é realmente importante para a utilização de maior valor no futuro. Nosso propósito era mostrar as incertezas e como as presunções variadas geram cenários diferentes para a ordem dos países. Uma segmentação diferente iria surgir se fizéssemos perguntas diferentes – considerando os resultados – tais como dados econômicos e geopolíticos por meio da IA, que podem ser atribuídos a cada país ou a classificação de cada país de acordo com a facilidade para gerar negócios nos dias de hoje à medida que se preparam para esse futuro, o que estamos desenvolvendo em projetos de estudos futuros.
Os dados são propulsores da nova economia, e serão ainda mais propulsores para a economia do futuro. A revista The Economist, ao declarar que em 2017 o petróleo não era mais o recurso de maior valor, mas sim, dados, afirmou: “Não importa se você está correndo, assistindo à TV ou simplesmente no meio do trânsito – praticamente toda atividade gera um controle de dados, gerando mais dados brutos para as “destilarias de dados”. Os algoritmos treinados para controlar os percursos de dados serão transformadores. É bem provável que uma nova ordem mundial surja – junto com um novo “Número de dados bruto” (GDP – Gross Data Product, em inglês) – que seja capaz de capturar um número emergente de poder e de riqueza das nações. Já passou do momento de identificar como é essa área, agora que as oportunidades de colaboração e competitividade estão surgindo.
Nota do editor: Cada classificação ou índice é somente uma maneira de analisar e comparar empresas ou locais, baseado numa metodologia de conjunto de dados. Na HBR, acreditamos que um índice bem elaborado tem condições de fornecer ideias úteis, mesmo que por definição seja uma amostra de um cenário maior. Sempre sugerimos que você estude a metodologia com cautela.
Bhaskar Chakravorti é reitor de Negócios Globais na The Fletcher School da Tuffs University e fundador e diretor executivo do Fletcher Institute for Business in the Global Context. É autor do livro The Slow Pace of Fast Change.
Ajay Bhalla é Executivo-Chefe de Soluções Corporativas em Segurança da rede mundial Mastercard. Bhalla também é membro do Comitê de Gestão da empresa e membro sênior na The Fletcher School’s Council on Emerging Market Enterprises.
Ravi Shankar Chaturvedi é Diretor Associado em pesquisas e Membro Pesquisador em Inovação e Mudança na Fletcher’s Institute for Business in the Global Context na Tuffs University.
Fonte: Harvard Business Review Brasil
Matéria: http://hbrbr.uol.com.br/quais-os-paises-que-estao-a-frente-na-economia-de-dados/