O projeto de pesquisa ExProsodia teve seu início em 2006, a partir da proposição de um modelo de análise da entoação que considerava especialmente as variações de frequência acima e abaixo da média acumulada no tempo dessas frequências. Os valores, então, eram tomados em intervalos de três semitons, que caracterizariam cinco áreas tonais significativas. Essa proposta, entretanto, não se mostrou coerente com as tentativas feitas para corroborá-la. Embora o tom médio obtido pela média acumulada no tempo das frequências se mostrasse bastante estável para ser tomado como referência, os intervalos fixos acima e abaixo desse tom médio não se mostraram significativos para serem tomados, também, como referências.
A partir de testes de percepção realizados no âmbito do projeto, as áreas tonais puderam ser simplificadas. Houve motivação para alargar a área correspondente ao tom médio para um intervalo de 7 semitons, regularmente distribuídos: 3 semitons acima do tom médio e 4 semitons abaixo. Embora o intervalo de 3 semitons acima fosse sempre regular, o intervalo abaixo teve menor regularidade, oscilando entre três e quatro semitons. As áreas tonais que ultrapassavam esse intervalo foram discriminadas como Foco/Ênfase, acima, e Finalização, abaixo.
O software elaborado em VBA do Excel que realizava esses cálculos foi, então, registrado em 2010. Essa versão fazia as análises com base nas hipóteses do tom médio, do Foco/Ênfase e da Finalização, como áreas significativas. Os resultados obtidos com essas análises mantiveram grande coerência entre si, quando aplicados a dados de língua portuguesa. Ao se analisarem dados de outras línguas, particularmente o inglês e o guarani, os resultados obtidos não mantinham a coerência. Essa diferença requereu que novas hipóteses fossem estabelecidas, especialmente quanto aos intervalos caracterizadores de áreas tonais.
Em 2018, desenvolveu-se uma nova versão do software ExProsodia, em que há possibilidade de se modificar os intervalos definidores de áreas tonais. Assim, o intervalo do tom médio pôde ser tratado a partir de variações perceptivas maiores ou menores. Na medida em que o tom médio é a referência para todas as demais medidas realizadas pelo software, foi necessário que todo o conjunto fosse reformulado de maneira a acompanhar as necessidades próprias dos falantes, sem que se perdessem as hipóteses iniciais.
Baseado em ampla bibliografia, o software foi então reformulado de maneira a contemplar dois pontos de referência: o tom médio global (o tom médio propriamente dito) e o tom médio local. O tom médio local toma como ponto de partida para seus cálculos os valores estabelecidos a partir do reset frasal. Esse reset frasal estabelece segmentações específicas na série temporal das frequências e reinicia o processo de cálculo da média acumulada no tempo. A hipótese desse tom médio local é a de que haja correlação entre cada um desses momentos de reset frasal e a constituição de frases lexicamente consideradas.
A possibilidade de se obter dois pontos de referência — o tom médio global e o tom médio local — para interpretar a curva entoacional, associada às segmentações propostas para os resets frasais, permitiu que se obtivesse uma gama maior de dados observáveis capazes de cobrir um igualmente maior espectro de variações tonais condicionadas tanto por necessidades expressivas intencionais, quanto não intencionais. De maneira geral, propõe-se que as variações do tom médio global sejam não intencionais, porque estariam associadas às condições emocionais do falante e que as variações do tom médio local sejam controladas pelo falante para obter algum tipo de expressividade desejada. Desse ponto de vista, entende-se que, pelo menos esses parâmetros podem ser utilizados como recursos gramaticalmente previsíveis no âmbito da língua portuguesa.