
Postado por Sa-ryong Kang e Caren Chang, engenheiros de relações com desenvolvedores
Mobilidade Kakao é a principal empresa de mobilidade da Coreia do Sul, oferecendo uma variedade de serviços de transporte e entrega, incluindo chamada de táxi, navegação, compartilhamento de bicicletas e scooters, estacionamento e entrega de encomendas, por meio de sua Kakao T aplicativo. A equipe em Kakao Mobility utilizou Gemini Nano através de API de prompt GenAI do kit de ML oferecer assistência de estacionamento para seu serviço de compartilhamento de bicicletas e uma experiência aprimorada de entrada de endereço para seus serviços de navegação e entrega.
O aplicativo Kakao T atende mais de 30 milhões de usuários no total, e seu serviço de compartilhamento de bicicletas é um dos serviços mais populares. Mas, infelizmente, muitos usuários estacionavam indevidamente as bicicletas ou scooters quando não estavam em uso. Esse comportamento levou a um influxo de violações de estacionamento e preocupações de segurança, resultando em reclamações públicas, multas e reboques. Estas questões começaram a afectar negativamente a percepção pública tanto da Kakao Mobility como dos seus serviços de partilha de bicicletas.
“Ao aproveitar a API GenAI Prompt do kit de ML e o Gemini Nano, conseguimos implementar rapidamente recursos que melhoram o valor social sem comprometer a experiência do usuário. A Kakao Mobility continuará a adotar ativamente a IA no dispositivo para fornecer serviços de mobilidade mais seguros e convenientes.” — Wisuk Ryu, chefe da divisão de desenvolvimento de clientes
Para resolver essas preocupações, a equipe inicialmente projetou um modelo de reconhecimento de imagem para notificar os usuários se sua bicicleta ou scooter estava estacionada corretamente de acordo com as leis e padrões de segurança locais. A execução deste modelo através da nuvem teria incorrido em custos significativos de servidor. Além disso, as fotos enviadas pelos usuários continham informações sobre o local de estacionamento, por isso a equipe queria evitar qualquer preocupação com privacidade ou segurança. A equipe precisava encontrar uma solução mais confiável e econômica.
A equipe também queria melhorar a experiência de extração de entidades para o serviço de entrega de encomendas no aplicativo Kakao T. Anteriormente, os usuários podiam solicitar facilmente a entrega de encomendas em uma interface de bate-papo, mas os motoristas precisavam inserir o endereço em um formulário de pedido manualmente para iniciar o pedido de entrega – um processo complicado e sujeito a erros humanos. A equipe procurou agilizar esse processo, tornando os formulários de pedido mais rápidos e menos frustrantes para o pessoal de entrega.
Aprimorando a experiência do usuário com a API GenAI Prompt do ML Kit
A equipe testou e comparou modelos Gemini baseados em nuvem com Gemini Nano, acessados por meio da API GenAI Prompt do ML Kit. “Depois de analisar a privacidade, o custo, a precisão e a velocidade de resposta, a API GenAI Prompt do ML Kit foi claramente a escolha ideal”, disse Jinwoo Park, desenvolvedor de aplicativos Android da Kakao Mobility.
Para resolver o problema de bicicletas ou scooters estacionadas incorretamente, a equipe usou a capacidade multimodal do Gemini Nano por meio do ML Kit GenAI API SDK para detectar quando uma bicicleta ou scooter viola os regulamentos locais ao estacionar em pavimento tátil amarelo. Com um prompt cuidadosamente elaborado, eles conseguiram avaliar mais de 200 imagens etiquetadas de fotos de estacionamento enquanto refinavam continuamente as informações. Essa avaliação, medida por meio de métricas conhecidas como exatidão, precisão, recall e pontuação F1, garantiu que o recurso atendesse aos padrões de qualidade e confiabilidade no nível de produção.
Agora os usuários podem tirar uma foto de sua bicicleta ou scooter estacionada, e o aplicativo irá informá-los se ela estiver estacionada corretamente ou fornecer orientação caso não esteja. Todo o processo acontece em segundos no aparelho, protegendo a localização e as informações do usuário.
Para criar um recurso simplificado de extração de entidades, a equipe usou novamente a API GenAI Prompt do ML Kit para processar pedidos de entrega dos usuários escritos em linguagem natural. Se tivessem empregado o aprendizado de máquina tradicional, seria necessário um grande conjunto de dados de aprendizado e conhecimentos especiais em aprendizado de máquina. Em vez disso, eles poderiam simplesmente começar com um prompt como “Extraia o nome, endereço e número de telefone do destinatário da mensagem”. A equipe preparou cerca de 200 exemplos de avaliação de alta qualidade e avaliou seu prompt por meio de várias rodadas de iteração para obter o melhor resultado. O método mais eficaz empregado foi uma técnica chamada prompting de poucos disparos, e os resultados foram cuidadosamente analisados para garantir que a saída continha o mínimo de alucinações.
“A API Prompt do ML Kit reduz a sobrecarga do desenvolvedor e, ao mesmo tempo, oferece forte segurança e confiabilidade no dispositivo. Ela permite a prototipagem rápida, reduz a dependência da infraestrutura e não incorre em custos adicionais. Não há razão para não recomendá-la.” — Jinwoo Park, desenvolvedor de aplicativos Android da Kakao Mobility
Entregando grandes resultados com a API GenAI Prompt do ML Kit
Como resultado, o recurso de extração de entidade identifica corretamente os detalhes necessários de cada pedido, mesmo quando vários nomes e endereços são inseridos. Para maximizar o alcance do recurso e fornecer um substituto robusto, a equipe também implementou um caminho baseado em nuvem usando Gemini Flash.
A implementação da API GenAI Prompt do ML Kit rendeu uma economia significativa de custos para a equipe Kakao Mobility ao mudar para IA no dispositivo. Embora o recurso de análise de estacionamento de bicicletas ainda não tenha sido lançado, a melhoria na entrada de endereço já produziu excelentes resultados:
-
O tempo de conclusão de pedidos para entrega foi reduzido em 24%.
-
A taxa de conversão aumentou 45% para novos usuários e 6% para usuários existentes.
-
Durante os períodos de pico, os pedidos alimentados por IA aumentam mais de 200%.
“Os proprietários de pequenas empresas, em particular, partilharam comentários muito positivos, dizendo que a funcionalidade tornou o seu trabalho muito mais eficiente e reduziu significativamente o stress”, acrescentou Wisuk.
Após o lançamento do recurso de reconhecimento de imagem para estacionamento de bicicletas e scooters, a equipe Kakao Mobility está ansiosa para melhorá-lo ainda mais. Os ambientes de estacionamento urbano podem ser desafiadores e a equipe está explorando maneiras de filtrar regiões desnecessárias das imagens.
“A API GenAI Prompt do ML Kit oferece recursos de alta qualidade sem sobrecarga adicional”, disse Jinwoo. “Isso reduziu o esforço do desenvolvedor, encurtou o tempo geral de desenvolvimento e nos permitiu focar no ajuste imediato para obter resultados de maior qualidade.”
Experimente você mesmo a API GenAI Prompt do ML Kit




