R
esumen
A
bstract
ISSN 2477-9105
Número 26 Vol.1 (2021)
62
En este trabajo se analiza la distribución personal de los ingresos en distintos niveles: nacional, pro-
vincial y por actividad económica para el período 2006-2016, a partir de la información de las encues-
tas de hogares. Para probar si los cambios en la distribución del ingreso personal a través del tiempo
son estadísticamente significativos, se aplican pruebas no paramétricas para k muestras basadas en la
Función de Distribución Empírica (FDE) y la Función de Densidad de Núcleo (KDE). Los resultados
muestran que, efectivamente en el período de tiempo analizado, hubo cambios en la distribución de
los ingresos personales, principalmente en la localización, más que en la forma, donde las pruebas a
partir de la FDE tienen un buen desempeño. En tanto que, a nivel territorial se evidenciaron cambios
en la forma de la distribución como es el caso Chimborazo, donde las pruebas basadas en la KDE,
como la norma L1 o el Área Común, rechazaron la hipótesis nula.
Palabras claves: Ingreso, encuestas a hogares, desigualdad, función de la densidad de núcleo (Ker-
nel), función de distribución empírica, programación en R.
This paper analyzes the personal income distribution at different levels: national, provincial and by
economic activity for the 2006-2016 period, based on information from household surveys. To test
whether changes in the distribution of personal income over time are statistically significant, non-pa-
rametric tests for k samples, based on the Empirical Distribution Function (EDF) and the Kernel
Density Function (KDE) are applied. The results show that, indeed in the time period analyzed, there
were changes in the distribution of personal income, mainly in location, rather than in form, where
the tests based on the EDF perform well. Meanwhile, at the territorial level, changes in the shape of
the distribution were evidenced, as in the case of Chimborazo, where the tests based on the KDE,
such as the L1 norm or the Common Area, rejected the null hypothesis.
Keywords: Income, household surveys, inequality, kernel density function, empirical distribution
function, R programming.
Fecha de recepción: 15-05-2021 Fecha de aceptación: 03-09-2021 Fecha de publicación: 13-10-2021
Lo
APLICACIÓN DE PRUEBAS NO PARAMÉTRICAS PARA K-MUESTRAS
PARA IDENTIFICAR CAMBIOS EN LA DISTRIBUCIÓN DEL INGRESO
EN ECUADOR 2006-2016.
Analysis of changes in income distribution, between 2006 t0 2016, applying non-
parametric k-sample tests.
1
Liliana Roldan ,
1
Miguel Flores ,
2
Ana Cabezas-Martínez*
1
Escuela Politécnica Nacional, Facultad de Ciencias, Departamento de Matemáticas, MODES /
SIGTI, Quito, Ecuador.
2
Facultad Latinoamericana de Ciencias Sociales, Departamento de Estudios Políticos, Quito, Ecuador.
*ana.cabezas90@gmail.com
I. INTRODUCCIÓN
El análisis de la distribución del ingreso perso-
nal permite visualizar los cambios en la misma
a lo largo del tiempo. En la presente investiga-
ción se analiza lo sucedido con la distribución
del ingreso personal del país, de las provincias,
considerando que se aprecia un desarrollo des-
igual a este nivel. Además, es importante conocer
qué ha sucedido a nivel de las actividades econó-
DOI: 10.47187/perf.v1i26.138
63
micas dada la segmentación del mercado laboral
en actividades de alta y baja productividad
1
, lo
que se traduce en desigualdades de ingresos en
los hogares.
Sea N el número de unidades de análisis (hogares
o personas) y sean los ingresos x_1,x_2,...,x_N
donde x_1<x_2<<x_N de cada unidad de aná-
lisis, respectivamente. Una forma de representar
la distribución del ingreso es la función de den-
sidad de frecuencias f(x). Para cualquier nivel de
ingresos x, f(x) dx es la proporción de receptores
de ingresos cuyos ingresos se encuentran en el
rango [x, x+dx], f(x) es independiente de la can-
tidad de unidades perceptoras de ingresos, o ta-
maño poblacional (N) y, por otro lado, es análoga
a una función de densidad de probabilidad.
Para modelizar la distribución del ingreso, las
formas funcionales dependen de las propieda-
des que se supone deben cumplir. En Dagum
(1) se encuentra una lista de once propiedades
que guían la selección del modelo entre las que
se encuentran: interpretación económica de los
parámetros, parsimonia, buen ajuste a lo largo de
todos los niveles de ingresos, entre otros.
Hasta los años setenta los modelos más utiliza-
dos fueron el de Pareto y el Lognormal, que sa-
tisfacen pocas de las propiedades descritas ante-
riormente y que son deseables. La distribución
de Pareto de acuerdo con su bondad de ajuste,
simplicidad funcional y la interpretación econó-
mica de sus parámetros, continúa siendo consi-
derada para la distribución de los grupos de in-
gresos muy altos, mientras que la Lognormal se
ajusta a toda la distribución del ingreso, pero es
bastante pobre en describir las colas de la distri-
bución. Luego estos modelos fueron superados
por aquellas distribuciones que toman en cuenta
la propiedad de parsimonia (1,2). Con el tiempo,
con el n de tener en cuenta varias regularidades
empíricas observadas y debido al aumento de la
capacidad computacional, se han desarrollado y
adoptado modelos estadísticos más generales.
Una forma alternativa de obtener estimadores de
la densidad de los ingresos es mediante métodos
no paramétricos. La gran ventaja es que en el
enfoque no paramétrico se libera de las especi-
caciones paramétricas y se permite que los datos
hablen por sí mismos. Se imponen supuestos mí-
nimos sobre los datos, como que la densidad de
ingresos debe existir y se debe satisfacer algunas
propiedades de suavizamiento.
De acuerdo con Pittau (3), un enfoque no pa-
ramétrico basado en la estimación de la densi-
dad de núcleo tiene mejores resultados, además
se pueden capturar incrementos absolutos en los
niveles de ingresos a la derecha o izquierda por
medio de cambios en la función de densidad.
Este método provee una imagen completa de la
distribución de ingresos en términos de la fun-
ción de densidad de frecuencia del ingreso, con
la que se puede observar el nivel de distribución,
modalidad y extensión, simultáneamente (4).
Para establecer si ha habido cambios estadísti-
camente signicativos en la distribución del in-
greso personal en el presente trabajo se aplican
contrastes no paramétricos de bondad de ajuste
para medir la igualdad de k distribuciones. Los
que se utilizan basados en la función de distri-
bución empírica (FDE) son las generalizaciones
de las pruebas de Kolmogorov – Smirnov (KS)
y Anderson, Darling (AD) discutidos en Kiefer
(5).
Además, bajo el supuesto de que las distribucio-
nes son totalmente continuas se presentan cuatro
estadísticos basados en la comparación de la fun-
ción de densidad núcleo (KDE). Los principales
supuestos para la construcción de estos estadís-
ticos, son que las k muestras observadas en rea-
lidad se generaron de la misma función de den-
sidad; y que, para cada muestra es posible tener
una KDE. Por lo que se podría diseñar y utilizar
diferentes medidas de similitud para cuanticar
las semejanzas entre los k diferentes KDE. Estas
medidas son: AC o área común, Norma L1, Dis-
tancia L2 o Euclidiana y Distancia Sk. Esta clase
de pruebas son prácticamente nuevas y reciente-
mente investigadas. Los resultados obtenidos (6),
a partir de simulación sugieren que las pruebas
basadas en KDE son más potentes cuando las po-
blaciones subyacentes dieren en su forma.
En este contexto y tomando en cuenta que en
muchos casos la función de densidad propor-
ciona una información más intuitiva y directa
que la función de distribución, además que la
estimación de densidades proporciona métodos
para abordar otros problemas como la discrimi-
nación, simulación, estimación de la moda, entre
otros, el presente trabajo de investigación es un
aporte ya que propicia el uso de otros estadísticos
para pruebas de k poblaciones basados en la fun-
____________________
1
Las personas empleadas en sectores de alta productividad tienen las siguientes características: mayor nivel educativo, mejores condiciones laborales como la formalidad o
formas de estabilidad en sus contratos y se ubican en empresas con uso intensivo de tecnología, mientras que en los empleos de baja productividad se encuentran trabajadores
con menores ingresos, menor nivel educativo, inestabilidad laboral, muchas veces sin contrato de trabajo o en la informalidad y poca cobertura de seguridad social (CEPAL
– CEPALSTAT).
Roldan, Flores, Cabezas
64
ción de densidad (KDE) en especial en variables
como el ingreso que presentan asimetría en su
distribución. A partir de los resultados obtenidos
se tendrán criterios para identicar el desempe-
ño de las pruebas aplicadas para k muestras.
En la sección 2 se desarrolla los aspectos más
importantes del marco teórico tanto los relacio-
nados con la distribución del ingreso como los
estadísticos utilizados para probar la igualdad
entre k muestras. También se describe la fuen-
te de información, la base de datos y el proceso
de tratamiento de los datos utilizados para este
trabajo; de igual manera se describe la metodo-
logía empleada y la aplicación de las pruebas de
hipótesis para k muestras basadas en la función
de distribución empírica (FDE) y la función de
densidad (KDE). Finalmente, se hace la valida-
ción de los resultados a partir del análisis de los
estudios de simulación realizados por los autores
que han aplicado estas pruebas.
En la Sección 3 se exponen los resultados ob-
tenidos. En un primer momento, se realiza el
análisis gráco de la distribución de los ingresos
personales tanto a nivel nacional como territo-
rial y por actividad económica, para estudiar si
estas siguen una distribución normal por lo que
se aplican varias pruebas que permitan conocer
si se rechaza o acepta la hipótesis de normalidad
de las distribuciones de los ingresos. A continua-
ción, se realiza un análisis gráco de las funcio-
nes de densidad de los ingresos, y en un tercer
momento, se presentan los resultados de la apli-
cación de los estadísticos propuestos con su nivel
de signicancia en cada caso y por cada método.
Finalmente, en la Sección 4 se incluyen las con-
clusiones derivadas del desarrollo del presente
trabajo, enfocándose en hallazgos encontrados
en cuanto a las diferencias en la distribución de
los ingresos y en los resultados sobre la aplica-
ción de las pruebas basadas en KDE y FDE, que
indican que las basadas en la FDE son mejores
cuando las distribuciones presentan cambios en
la localización más que en la forma, como sucede
en algunas de las desagregaciones analizadas.
II. MATERIALES Y MÉTODOS
La literatura distributiva utiliza el término dis-
tribución del ingreso “para hacer referencia a la
lista completa de ingresos en una comunidad y
no a alguna medida de disparidad de esos valores
entre las personas” (7).
En el presente trabajo la discusión está enmar-
cada en el análisis de la función de distribución
empírica del ingreso
2
, se hace referencia a aquel
recibido de manera personal por un individuo –
en su mayoría, una persona con empleo; por lo
que no se hacen ajustes para obtener un ingreso
per cápita familiar u otra medida que dé cuenta
de ajustes por factores demográcos o arreglos
intrahogar.
El uso del enfoque paramétrico para el análisis
distributivo se aplica ampliamente en la literatu-
ra estadística ya que algunas formas funcionales
son idóneas para modelar algunas características
de muchas distribuciones empíricas de los ingre-
sos (8).
Como se señaló anteriormente existe la posibi-
lidad de no predeterminar ningún modelo para
la distribución de probabilidad de la variable y
dejar que la función de densidad pueda adoptar
cualquier forma. A este enfoque se lo denomina
estimación no paramétrica de la densidad y tiene
entre sus orígenes los trabajos de Fix y Hodges
(9).
Varios han sido los autores que han utilizado este
enfoque para analizar la distribución del ingre-
so (10). Burkhauser, Crews, Daly y Jenkins (11),
utilizaron la estimación de densidad de núcleo
/ kernel para examinar los cambios en la distri-
bución de los ingresos de los hogares de Estados
Unidos en los años 80. Liu y Zou (12) estudian
la creciente desigualdad de ingresos en China en
las últimas tres décadas con énfasis en la migra-
ción urbana-rural, el progreso económico y tec-
nológico. Nenovsky y Tochkov (13) examinan el
proceso de convergencia entre Europa Central y
Oriental (CEE) y la Unión Europea (UE) durante
todo el período de transición. Para ello se cons-
truyen las distribuciones de densidad de núcleo /
kernel y analizan la evolución de su forma para
determinar tendencias de convergencia.
Estadísticos basados en la Función de Distribu-
ción Empírica (FDE)
Con estas pruebas se realiza la comparación en-
tre F
n
(X) (la FDE) y F(X) la función de distribu-
ción acumulada (FDA) para ver si coinciden.
Esto lleva al desarrollo de los estadísticos basados
en FDE que utilizan las diferencias entre F
n
(x) y
____________________
2
La teoría nos dice que la función de distribución F(x) provee la proporción de individuos de la población con un nivel por debajo o igual a x (Lubrano,
2017). Un estimador natural se obtiene para F(.) considerando:
donde Π(.) es la función indicadora (Lubrano, 2017).
65
F(x) para determinar si la muestra proviene de
F(x).
Cuando se analizan varias muestras, es de interés
conocer si proceden de la misma población.
Se supone que se tiene n
i
observaciones genera-
das de una función de densidad de probabilidad
k, f
i
,i=1,2,…,k, y el interés es probar la hipótesis
nula.
(1)
Distancia de Kolmogorov-Smirnov
(2)
Para t Î , y donde F
n
es la función de distribu-
ción empírica que corresponde a la muestra con-
junta y F
ni
es la función de distribución empírica
acumulada relacionada con la i-ésima muestra.
Cramér-Von Mises: La generalización de este es-
tadístico para el problema de comparación de
k-muestras independientes fue propuesta por (5)
y está denida como:
(3)
Donde dadas k-muestras independientes de ta-
maños n
1
,…,n
k
, F
ni
(t), representa la FDE asociada
a la i-ésima muestra (1≤i≤k) y
(7)
Anderson-Darling: La prueba para k-muestras
de Anderson-Darling es una prueba de rango y,
por lo tanto, no hace las suposiciones restrictivas
de los modelos paramétricos. Suponiendo que la
i-ésima muestra tiene una función de distribu-
ción continua F
ni
y la nalidad es probar la hi-
pótesis H
0
=F
1
=  =F
k
sin hacer especicaciones
sobre la distribución conjunta F.
Se denota la función de distribución empírica de
la i-ésima muestra como F
ni
(t) y la de la muestra
agrupada de todas las N=n
1
++n
k
observacio-
nes por F
n
(t). El estadístico de la prueba Ander-
son-Darling para k-muestras se dene como:
(4)
Estadísticos basados en la Función de Densidad
de Núcleo (KDE)
Suponiendo que se quiere probar si k diferentes
muestras observadas se generaron de la misma
función de densidad de probabilidad subyacente,
y suponiendo que, para cada muestra, es posi-
ble obtener una estimación de densidad de nú-
cleo (Kernel), KDE. Intuitivamente, si todas las
k-muestras han sido generadas desde la misma
función de densidad de probabilidad, entonces
los k diferentes KDE obtenidos deberían ser muy
similares. Esto sugiere que uno podría diseñar y
usar diferentes medidas de similitud para cuan-
ticar las semejanzas entre los k diferentes KDE,
en la forma de un único valor escalar, un estadís-
tico.
Área Común, AC: Este nuevo concepto fue intro-
ducido por Martinez-Camblor (7), está denido
cómo:
(5)
Donde f
ni
, es el estimador de la densidad de nú-
cleo perteneciente a la i-ésima muestra. AC es el
área común donde las k densidades se superpo-
nen. Si el valor es cercano a uno, las funciones
de densidad de probabilidad son casi idénticas, y
la hipótesis H
0
nula que formula que f
1
=f
2
=  =f
k
no puede ser rechazada. Por otro lado, un valor
pequeño de AC signica que las muestras pro-
bablemente son generadas a partir de diferentes
distribuciones.
Norma L1: Si se denota f
ni
como el estimador de
la densidad de núcleo, KDE, perteneciente a la
i-ésima muestra de tamaño n
i
, i=(1,2,…,k), sien-
do k el número de muestras y f
n
la KDE de la
muestra conjunta con n=n
1
+n
2
++n
k
. Así la ge-
neralización de la distancia L
1
puede ser escrita
de la siguiente manera:
(6)
De acuerdo a la denición del Área Común, se
puede observar que para el caso k=2, el área co-
mún puede ser considerada como una generali-
zación de la distancia L
1
.
Distancia L2 o Euclidiana. De acuerdo a Baranza-
no [1], se dene como:
(7)
Para f
ni
,f
n
,n
i
y n denidos de la misma forma que
para L1. Nótese que si se reemplaza f() por F(),
se obtiene esencialmente la generalización de las
pruebas para k muestras de Cramér-von Mises.
Distancia S
(8)
De acuerdo a esta expresión se puede ver la ana-
logía con la distancia de Kolmogorov-Smirnov
en este caso la diferencia está, que en el contraste
con la distancia KS que utiliza la función de dis-
tribución empírica acumulada FDEA, el cálculo
de la distancia S se basa en las KDE (14).
De acuerdo a los objetivos planteados, se aplican
estas pruebas para identicar los cambios en la
distribución del ingreso en el país a nivel de pro-
vincia y actividad económica.
El procedimiento metodológico aplicado consiste
Roldan, Flores, Cabezas
66
en las siguientes fases: en un primer momento
se realiza la descripción de las bases de datos a
utilizar, luego se dene la variable de interés, a
continuación se realiza el análisis exploratorio de
esta variable a partir de las bases de datos de las
encuestas de empleo para el período 2006-2016,
el siguiente paso consiste en la estimación de las
funciones de densidad y de distribución para la
aplicación de las pruebas propuestas, nalmente,
se analizan e interpretan los resultados.
La principal fuente de información será el Insti-
tuto Nacional de Estadísticas y Censos –INEC-,
entidad encargada de proveer la estadística ocial
del país. Puntualmente se hará uso de los datos
levantados en la Encuesta Nacional de Empleo,
Desempleo y Subempleo ENEMDU. Uno de los
propósitos de la encuesta es, conocer la actividad
económica y las fuentes de ingresos de la pobla-
ción.
Para los nes de este trabajo el análisis se realiza-
rá en función del ingreso personal total, no solo
reeja la capacidad de obtener ingresos de un
individuo, sino que también mide su potencial
sobre el bienestar (15).
Además, se adoptó la transformación logarítmica
de los ingresos, con el n de capturar adecuada-
mente la estructura subyacente de las densidades
en el rango de ingresos más bajos (16).
Debido a que la forma de la distribución del in-
greso es sensible a las uctuaciones de los precios
y que se realizarán comparaciones de los cambios
reales en el ingreso promedio y en el movimiento
de la distribución a través de los años, los ingre-
sos utilizados han sido ajustados por el Índice de
Precios al Consumidor (IPC)
3
de diciembre de
2016.
Ya que se realizará un análisis temporal entre el
año 2006 y 2016, solo se tomaron en cuenta las
provincias que tienen información para todos los
años. En el caso de las provincias de la Amazonía
de acuerdo al INEC, estas solo son representati-
vas en la ENEMDU a partir del 2014 por lo que
se dispone de tres años de análisis, por esta razón
se ha agrupado a estas provincias en un solo do-
minio. Se analiza un total de 16 dominios.
Para el análisis de los ingresos por actividad eco-
nómica se utilizará la Clasicación Industrial
Internacional Uniforme de Actividades Econó-
micas (CIIU Revisión 4.0) que sirve para clasi-
car uniformemente las actividades o unidades
económicas de producción, dentro de un sector
de la economía, según la actividad económica
principal que desarrolle. Fue necesario efectuar
una correlación de la “Clasicación Nacional de
Actividades Económicas” (CIIU Rev. 4.0), con la
versión anterior “Clasicación Nacional de las
Actividades Económicas de acuerdo a la CIIU –
Rev. 3.1”. De acuerdo a la clasicación CIIU Rev.
4 se cuenta con 22 actividades, sin embargo, por
la baja participación en algunas de ellas se optó
por realizar el análisis de la distribución del in-
greso para 7 ramas de actividad que comprenden
en promedio el 75% de las personas ocupadas.
Procedimiento para el análisis de la forma de la
distribución del ingreso a partir de métodos no
paramétricos.
Las representaciones grácas, como histogra-
mas, curvas de Lorenz, grácos de probabilidad
normal o Q-Q Plot Normal y desles de enanos
de Pen, se han utilizado con frecuencia como he-
rramientas alternativas o complementarias para
resumir las distribuciones de ingresos. Estos
grácos no se centran simplemente en una ca-
racterística especíca de la distribución, como lo
hacen las diversas medidas puntuales, sino que
resumen varias características de la distribución
completa.
En este marco, el gráco de probabilidad normal
nos permite comparar la distribución empírica
de un conjunto de datos con la distribución Nor-
mal. Supongamos que disponemos de un con-
junto de observaciones x
i
,(i=1,2,…,n).
Sea F(x) la función de distribución de una dis-
tribución especicada. El gráco de probabilidad
seconstruye de la siguiente manera:
1) Se ordena las observaciones de menor a mayor
en la forma x
(1)
≤x
(2)
≤  ≤x
(n)
2) Se determina los valores
(9)
Si por Q
x
(p) notamos al cuantil de orden
p(0<p<1) de las observaciones, tenemos que:
x
i
=Q
x
(p
i
) i=1,2,…,n
3)Determinar los cuantiles de orden p
i
,i=1,2,…
,n de la distribución teórica representada por la
función de distribución F, es decir:
Q
t
(p
i
)=F
-1
(p
i
) i=1,2,…,n
4) Representar el conjunto de puntos (Q
t
(p
i
),
Q
x
(p
i
)),i=1,2,…,n o ((F
-1
)p
i
,x
i
)
____________________
3
El Índice de Precios al Consumidor (IPC) es la medida de variación en el nivel general de precios de los bienes y servicios que consumen los hogares en una economía; estas
variaciones inciden directamente en el poder adquisitivo de los consumidores y en su bienestar (CEPAL, INEC, 2017). Además, en los Boletines Técnicos del IPC publicados
por el INEC, se dene como un indicador de los precios de la economía nacional que se construye con los precios nales de 359 productos de mayor consumo y utilización.
Su periodicidad es mensual y su año base es el 2014 (INEC, 2018b).
67
Si la distribución teórica constituye una buena
aproximación de la distribución empírica, es de
esperar que los cuantiles de los datos estén muy
próximos a los de la distribución teórica y, por
tanto, los puntos del gráco estarán muy pxi-
mos a la bisectriz del primer cuadrante.
Por otra parte, la función de densidad de núcleo
(Kernel) y sus grácos correspondientes propor-
cionan una interpretación simple y directa de la
distribución del ingreso. El mecanismo para el
presente análisis será a través de la estimación de
la densidad de núcleo.
Supongamos que queremos probar la igualdad
de k poblaciones con densidades f_1,…,f_n, da-
das k muestras aleatorias
, extraí-
das independientemente de sus respectivas den-
sidades. El estimador de la densidad de núcleo
está dado por:
(10)
Donde K(x) es una función denominada fun-
ción Núcleo, que cumple algunas condiciones
de regularidad, generalmente es una función de
densidad simétrica de media cero, {h
n
} es una se-
cuencia de constantes positivas conocida como
ancho de banda, parámetro de suavización o
bandwith. Si h∞, entonces para todo x.
El estimador de densidad de núcleo será obteni-
do a partir de la función density de R que tiene
los siguientes argumentos:
density(x, bw = "nrd0", adjust = 1, kernel = c("-
gaussian", "epanechnikov", "rectangular", "trian-
gular", "biweight", "cosine", "optcosine"), weights
= NULL, window = kernel, width, give.Rkern
= FALSE, n = 512, from, to, cut = 3, na.rm = FAL-
SE, …)
Donde,
x son los datos a partir de los cuales se calculará
la estimación,
bw, es el ancho de banda suavizado que será
utilizado. El valor predeterminado, "nrd0", es
0.9 veces el mínimo de la desviación estándar y
el rango intercuartil dividido por 1.34 veces el
tamaño de la muestra a una potencia quinta ne-
gativa ('regla de oro' de Silverman) a menos que
los cuartiles coincidan cuando se garantice un
resultado positivo.
kernel, una cadena de caracteres que contiene la
lista de núcleos que serán utilizados, tiene como
predeterminado el núcleo gaussiano.
n, es el número de puntos igualmente espa-
ciados en los que se debe estimar la densidad, si
n>512, se redondea a una potencia de 2 durante
los cálculos y el resultado es interpolado.
Para gracar la función de densidad de núcleo de
los ingresos se utiliza la librería plotly y ggplot2
de R.
Procedimiento para la aplicación de las pruebas
no paramétricas para k muestras
Se consideran las siguientes hipótesis nulas sobre
la homogeneidad de k poblaciones (X
i,j
):
Basadas en la función de distribución:F
1
=F
2
=...F
k
Basadas en la función de densidad: f
1
=f
2
=...f
k
a) Aplicación de la generalización de la prueba
para k muestras de Kolmogorov – Smirnov (KS)
Para la implementación del algoritmo que per-
mita obtener este estadístico se siguió lo desarro-
llado por Baranzano (14) en el que se aplica una
prueba basada en permutaciones para probar la
hipótesis nula H
0
de igualdad de k poblaciones.
Es importante indicar que en el trabajo men-
cionado solo se realiza una aplicación para tres
muestras por lo que el algoritmo propuesto en
este trabajo es un aporte al extender el procedi-
miento a k muestras.
El procedimiento se aplica de la siguiente mane-
ra:
Supongamos que se tienen dos muestras X y Y
que pertenecen a la misma distribución y repre-
sentan la hipótesis nula H
0
siendo la hipótesis al-
ternativa que las muestras provienen de diferen-
tes distribuciones.
Denotamos K
Skobs
el estadístico observado y T
obs
calculado de las muestras de datos simulados.
Los elementos de X y Y se juntan y permutan,
luego de la permutación, los elementos se divi-
den en dos grupos X y Y, preservando el tamaño
muestral original de estas muestras.
Luego el nuevo estadístico K
Sk
=T
k
es calculado de
los datos permutados. Este procedimiento se re-
pite 1000 veces, resultando en 1000 estadísticos
T
1
,…,T
199
, con lo que se construye la distribución
del estadístico, conocida como distribución de
permutación bajo la hipótesis nula.
El p valor se calcula como:
(11)
Para 1≤i≤1000
Aquí #(A) representa el número de veces que el
evento A se satisface y N
p
el número de permuta-
ciones realizadas. Para incluir el estadístico ob-
Roldan, Flores, Cabezas
68
servado se añade 1 al número total de cálculos,
luego el pvalor se puede expresar como:
(12)
Si el pvalor<α, la hipótesis nula H
0
se rechaza, α
representa el nivel de signicancia, que es la can-
tidad de evidencia requerida para aceptar que
es improbable que un evento haya surgido por
casualidad (azar). En otras palabras, si es poco
probable que se obtenga Tobs cuando se permuta
(≤α), luego la hipótesis nula se rechaza. El valor
seleccionado para α es 0.05.
Las variables de entrada para su aplicación son
una lista que contiene la variable del logaritmo
del ingreso personal total real por provincia y
por año; así como una lista de la variable del lo-
garitmo del ingreso personal total real por rama
de actividad y por año. Para obtener el p valor se
utilizaron 1,000 permutaciones, el desarrollo del
código se encuentra en el Apéndice.
b)Aplicación de la generalización de la prueba
para k muestras de Anderson Darling (AD)
Otra de las pruebas basadas en FDE es la genera-
lización para k muestras de la prueba de Ander-
son, Darling (A
D
) discutidos en (5).
Para la aplicación de esta prueba se utiliza el
paquete kSamples desarrollado en R por Fritz
Scholz y Angie Zhu en agosto de 2017
4
. Este pa-
quete tiene como objetivo comparar k muestras
utilizando, entre otros, el estadístico de Ander-
son-Darling, así como el de Kruskal-Wallis con
diferentes criterios de puntajes. Calcula p valores
asintóticos y p valores exactos (simulados o limi-
tados). Para obtener más detalles se puede acce-
der a la documentación del paquete disponible
en el repositorio CRAN de R (17).
c) Aplicación de las pruebas basadas en la fun-
ción de densidad - KDE
Las pruebas que serán desarrolladas en este tra-
bajo son:
• Generalización para k muestras de la norma L
1
• Generalización para k muestras de la norma L
2
• Generalización para k muestras de la distancia
S
k
• Generalización para k muestras del Área Co-
mún AC
El estadístico del Área Común es desarrollado
por el método de permutaciones, siguiendo un
procedimiento similar al detallado en el apartado
anterior el código se encuentra en Apéndice.
Par la aplicación de las tres pruebas propuestas
basadas en KDE, con los que se realiza el con-
traste de la hipótesis nula, se ha implementado
un código en R siguiendo el trabajo desarrollado
(4), en este trabajo solo se había implementado la
función L
1
para dos muestras, por lo que este tra-
bajo aporta con el desarrollo del algoritmo de las
generalizaciones para k muestras de las pruebas
L
1
, L
2
, AC y S
k
.
El código en R de las funciones se encuentra en
el Apéndice.
d) Planteamiento Bootstrap
El estimador núcleo de la densidad f
ni
(i=1,2,3)
utiliza para el cálculo de los estadísticos L
1
, L
2
y
S
k
un ancho de ventana de la forma
donde
, representa la desviación estándar en
la i-ésima muestra y donde S varía en una deter-
minada matriz de valores.
En todos los casos se utilizó el núcleo Gaussiano.
En este contexto, en el que el supuesto es que las
poblaciones de origen son continuas, el método
con el que se obtiene mejores resultados para la
aproximación del valor crítico de los estadísticos
de prueba a un nivel α es el Bootstrap suavizado,
que se basa en la generación de muestras desde
la Función de Distribución Empírica Suavizada
(FDES), dada una muestra aleatoria X=x
1
,…,x
n
,
queda denida de la siguiente manera:
(13)
Donde es una función de distribución, usual-
mente elegida de modo que su derivada sea una
función de densidad simétrica, de media cero y
varianza nita; h=h(n) es una sucesión de núme-
ros reales positivos, como parámetros ventana,
que en general no son de la misma naturaleza
que los utilizados en la estimación de núcleo para
la función de densidad. Dadas k muestras alea-
torias simples X=X
1
,…,X
k
de tamaños n
1
,…,n
k
,
respectivamente, se construye una región crítica
para el contraste:
H
0
:f
i
=f
j
, j 1,…,k;
H
1
=no se cumple H
0
Asumiendo que la hipótesis nula es cierta, y si las
muestras son independientes, es razonable plan-
tear el siguiente plan de remuestreo:
• Desde la muestra conjunta X, se calcula la FDES
denida en (60) y se calcula el estadístico F(X).
____________________
4
Actualizado al 20 de mayo de 2019. (Scholz & Zhu , 2019)
69
• Aleatoriamente, se generan B remuestras
Bootstrap (X
b
) de tamaño n
i
(i=1,…,n) de la dis-
tribución calculada en el paso anterior. Para cada
muestra Bootstrap se calcula el valor del estadís-
tico F(X
b
) .
• Se aproxima la distribución del estadístico
F(X) a partir de los valores F(X
b
) y se toma el 1-α
percentil a lo largo de las remuestras Bootstrap
como el valor crítico.
Las variables de entrada son: Una lista que con-
tiene la variable del logaritmo del ingreso perso-
nal total real por provincia y por año; así como
una lista de la variable del logaritmo del ingreso
personal total real por rama de actividad y por
año. Para la aplicación de estas pruebas se utili-
zaron 500 remuestras en la función de Bootstrap.
En el Apéndice se encuentra el código desarro-
llado en R.
III. RESULTADOS
En América Latina la desigualdad de la distribu-
ción del ingreso se ha reducido desde principios
de la década de 2000, gracias a un aumento más
rápido de los ingresos en los quintiles más ba-
jos que en el resto de la población. No obstan-
te, el ritmo de reducción de la desigualdad se ha
desacelerado y, de acuerdo con fuentes comple-
mentarias a las encuestas de hogares, no ha dis-
minuido e incluso puede haber aumentado la
participación de los grupos más ricos en el total
de los ingresos (18).
Al analizar las cifras de pobreza por ingresos en
el Ecuador para el período 2006-2016
5
, a nivel
nacional se encuentra que la incidencia de la po-
breza extrema se redujo a la mitad en el período
analizado y la incidencia de la pobreza se redujo
en alrededor de 15 puntos porcentuales (19).
Esta tendencia de reducción se mantiene en
este período para las provincias de la Sierra y la
Costa. Sin embargo, las provincias de la Amazo-
nía muestran un panorama diferente. Analiza-
da como un solo dominio, entre 2006 y 2016 la
Amazonía mantuvo constante su incidencia de
pobreza extrema. Y más aún, en 2016 las provin-
cias de Morona Santiago, Napo y Pastaza tuvie-
ron tasas de pobreza extrema superiores al 30%.
En cuanto a las ramas de actividad económica se
aprecia que la Agricultura, ganadería, silvicultu-
ra y pesca es la que concentra la mayor cantidad
de personas en situación de pobreza, a 2016 el
46% de la población ocupada en estas activida-
des es pobre. En el período analizado todas las
ramas de actividad han reducido la tasa. Siendo
las que más la Agricultura y la Construcción con
reducciones de 14 y 12 puntos porcentuales. Las
que menos la Administración pública, defensa
y seguridad social y Enseñanza que para 2016
prácticamente no registran población pobre por
ingresos.
Los últimos veinticinco años, 1990-2014, mues-
tran varios hechos que marcan la trayectoria de
la economía ecuatoriana. Se pueden distinguir
tres períodos de análisis: 1990-1999, 2000-2006,
y 2007-2014 (20).
El PIB de Ecuador, en el cuarto trimestre de 2016,
a precios constantes, mostró una tasa de varia-
ción anual (t/t-4, respecto al cuarto trimestre de
2015) de -1.2%. Desde 2005, las tasas de creci-
miento del PIB en Ecuador han sido altas, con
excepción de 2009, 2015 y 2016. De acuerdo a las
cifras del precio real del petróleo y los términos
de intercambio, estos son precisamente los años
en que las condiciones externas se volvieron des-
favorables para Ecuador. De hecho, para el perío-
do 2005–2015, la correlación entre el crecimien-
to del precio real del petróleo y el crecimiento del
PIB ha sido de 0,74 (20). Durante este período,
como ya se revisó, la pobreza y la desigualdad
disminuyeron signicativamente.
Análisis de la Normalidad de las Distribuciones
del Ingreso en el Período 2006-2016
Se realiza el contraste de las siguientes hipótesis:
H
0
= La distribución de los ingresos per-
sonales proviene de una normal entre los años
2006 a 2016
H
1
= La distribución de los ingresos per-
sonales no proviene de una distribución normal
entre los años 2006 a 2016
En primer lugar, se realiza un análisis a partir de
grácos de probabilidad normal o Q-Q Plot Nor-
mal
A continuación, para ilustrar este análisis solo
se presentan los grácos a nivel nacional, de las
ramas de actividad Agricultura, ganadería, caza,
____________________
5
La información presentada en este Capítulo proviene de la Encuesta Nacional de Empleo Desempleo y Subempleo (ENEMDU), que realiza el Instituto Nacional de
Estadísticas y Censos (INEC), los datos de la mayoría de indicadores están publicados en las siguientes páginas: Portal ocial del INEC, https://www.ecuadorencifras.gob.ec/
estadisticas/. Página web del Sistema Integrado de Conocimiento y Estadística Social del Ecuador (SICES), http://www.conocimientosocial.gob.ec/ y, página web del Sistema
Nacional de Información (SNI), http://menucloud.sni.gob.ec/web/menu/. Los valores de los indicadores correspondientes a la actividad económica que no se encontraron en
las páginas citadas fueron calculados a partir de la sintaxis publicada en las Fichas metodológicas de los indicadores de pobreza y desigualdad.
Roldan, Flores, Cabezas
70
silvicultura y pesca y Enseñanza y de las provin- cias de Chimborazo, Azuay y El Oro.
Figura 1. Gráco de probabilidad normal o Q-Q Plot Normal de los ingresos totales personales reales período 2006-2016
71
Para inferir que la distribución de los ingresos
personales en cada una de las desagregaciones
proviene de una Normal las curvas deberían
ajustarse a la línea roja, es decir que el valor del
cuantil de la muestra coincide con el valor exacto
del cuantil teórico correspondiente.
Sin embargo, de acuerdo a los resultados obteni-
dos, en la Figura 1 se puede apreciar que en todos
los casos los datos no se distribuyen simétrica-
mente y muestran un sesgo a la izquierda, con
colas pesadas a la izquierda y en menor medida a
la derecha. También, se observa que estas carac-
terísticas en la mayoría de los casos se acentuan
en el 2016. Estas características dan indicios de la
desigualdad de la distribución de los ingresos ya
que las curvas no se asemejan a una curva Nor-
mal.
Para conrmar o rechazar la hipótesis nula de
normalidad de los ingresos se aplican dos prue-
bas:
Prueba de Lilliefors (Kolmogorov-Smirnov) es
una prueba ómnibus basada en la FDA para la
hipótesis compuesta de normalidad. El estadísti-
co de la prueba es la máxima diferencia absoluta
entre la función de distribución acumulativa em-
pírica y la hipotética.
Puede calcularse como D=max{D
+
,D
-
}, para su
aplicación se utiliza el paquete “nortest” de R
(21).
Prueba de Jarque Bera, l procedimiento de esta
prueba es bastante diferente al de las pruebas
Kolmogorov-Smirnov y Shapiro-Wilk, esta prue-
ba se centra en la asimetría y la curtosis de los
datos de la muestra y compara si coinciden con
la asimetría y la curtosis de la distribución nor-
mal. Su aplicación se realiza con el paquete “nor-
mtest” de R (22).
Es importante indicar que se aplican estas pruebas
como alternativa a las ya descritas en este estudio
como son las pruebas de Kolmogorov-Smirnov,
Anderson Darling y Cramer Von Mises.
Se obtiene los siguientes resultados:
Nivel
Prueba de Jarque.bera Prueba Lilliefors (Kolomogorv-Smirnov)
2006 2016 2006 2016
Estadístico P - valor Estadístico P - valor Estadístico P - valor Estadístico P - valor
Nacional 851,06 2,20E-16 11117 2,20E-16 0,091886 2,20E-16 0,13967 2,20E-16
PROVIN-
CIA
AZUAY 91,785 2,20E-16 912,04 2,20E-16 0,078767 2,20E-16 0,12788 2,20E-16
BOLIVAR 31,541 1,42E-07 228,86 2,20E-16 0,083058 2,20E-16 0,14565 2,20E-16
CAÑAR 75,601 2,20E-16 74,235 2,20E-16 0,087989 2,20E-16 0,070922 2,20E-16
CARCHI 56,226 6,18E-13 253,23 2,20E-16 0,085892 2,20E-16 0,10993 2,20E-16
COTOPAXI 38,246 4,96E-09 524,12 2,20E-16 0,090241 2,20E-16 0,13728 2,20E-16
CHIMBORAZO 15,247 0,000488 205,91 2,20E-16 0,064607 2,20E-16 0,1466 2,20E-16
EL ORO 195,81 2,20E-16 951,19 2,20E-16 0,12337 2,20E-16 0,12412 2,20E-16
ESMERALDAS 73,86 2,20E-16 264,01 2,20E-16 0,098887 2,20E-16 0,12551 2,20E-16
GUAYAS 123,96 2,20E-16 2577,9 2,20E-16 0,10304 2,20E-16 0,14066 2,20E-16
IMBABURA 48,964 2,33E-11 635,89 2,20E-16 0,094943 2,20E-16 0,11653 2,20E-16
LOJA 48,815 2,51E-11 97,573 2,20E-16 0,069884 2,20E-16 0,0589 2,20E-16
LOS RIOS 134,11 2,20E-16 623,62 2,20E-16 0,1306 2,20E-16 0,15071 2,20E-16
MANABI 54,241 1,67E-12 570,41 2,20E-16 0,098618 2,20E-16 0,15476 2,20E-16
PICHINCHA 487,42 2,20E-16 1519,4 2,20E-16 0,11424 2,20E-16 0,19956 2,20E-16
TUNGURAHUA 68,256 1,55E-15 2195,7 2,20E-16 0,095914 2,20E-16 0,1479 2,20E-16
AMAZONÍA 60,348 7,86E-14 1064,5 2,20E-16 0,08411 2,20E-16 0,11952 2,20E-16
RAMA DE
ACTIVI-
DAD
Agricultura 502,29 2,20E-16 5848,2 2,20E-16 0,098974 2,20E-16 0,13081 2,20E-16
MANUFACTURA 379,06 2,20E-16 1548,4 2,20E-16 0,088266 2,20E-16 0,1205 2,20E-16
COMERCIO 220,6 2,20E-16 2039,2 2,20E-16 0,06417 2,20E-16 0,077493 2,20E-16
ENSEÑANZA 1829,2 2,20E-16 11766 2,20E-16 0,081033 2,20E-16 0,086388 2,20E-16
ADMINISTRACIÓN PÚBLICA 569,97 2,20E-16 10223 2,20E-16 0,052155 1,98E-07 0,060321 2,20E-16
CONSTRUCCIÓN 741,02 2,20E-16 1564 2,20E-16 0,12296 2,20E-16 0,10933 2,20E-16
Tabla 1. Pruebas de normaldad.
Los resultados obtenidos en la Tabla 1 muestran
que en todos los casos no se puede aceptar la hi-
pótesis nula y por el contrario se acepta la hipó-
tesis alternativa que indica que la distribución
de ingresos no sigue una Normal y por tanto se
justica el enfoque no paramétrico para medir
Roldan, Flores, Cabezas
72
los cambios en la distribución de los ingresos a
través del tiempo y por distintos segmentos de la
población
Análisis de la Homogeneidad de las Distribu-
ciones del Ingreso en el Período 2006-2016
Se contrastó las siguientes hipótesis:
H
0
= No existen cambios en la distribu-
ción de los ingresos personales (función de den-
sidad) entre los años 2006 a 2016
H
1
= Existen cambios en la distribución
de los ingresos personales (función de densidad)
entre los años 2006 a 2016
En primer lugar, se realiza un análisis gráco de
las funciones de densidad de los ingresos perso-
nales totales reales para el período de estudio.
La Figura (2) de la función de densidad de nú-
cleo para la distribución de los ingresos totales
por año muestra en general la concentración de
la población en cada nivel de ingresos, particu-
larmente se aprecia:
• Los cambios en la forma y localización de la
distribución (respecto a la media o mediana) en-
tre 2006 y 2016 con un movimiento hacia la de-
recha y aplastamiento de la función de densidad
tiene implicancias en términos de crecimiento
y desigualdad. El movimiento hacia la derecha
es reejo de un aumento del ingreso medio de
la población, el aplastamiento de la función de
densidad para 2016, sugiere un incremento de la
desigualdad.
• Un desplazamiento de la distribución de los in-
gresos a la derecha, el promedio de los ingresos
entre 2006 a 2016 se incrementó en un 14%. Sin
embargo, entre 2015 y 2016 el ingreso real de-
crece en un 4.82% (de una media de 531 a 506
dólares). Por su parte el salario básico unicado
pasó de 160 a 366 dólares es decir se incremen-
tó alrededor del 44%. Además, un traslado de las
densidades hacia la derecha, explican la reduc-
ción de la pobreza, que para el caso del país en
el período analizado se redujo en 15 puntos por-
centuales (23).
• La forma de la distribución tiene la caracterís-
tica de mostrar un grupo con una alta concen-
tración alrededor de los valores de la moda y la
media, lo que indicaría una menor desigualdad.
Lo que también se reeja en las medidas puntua-
les del coeciente de Gini, que ha permanecido
estable en los últimos años (a partir de 2011). Se
verica que la desigualdad de ingresos ha dismi-
nuido a nivel nacional en el período analizado
2007-2015 (24).
• Se puede diferenciar tres períodos, el prime-
ro que es el salto de la distribución del 2006 al
2009, luego entre 2010-2012 se mantiene estable,
alcanzando el mayor pico en 2012, para luego
disminuir el nivel de la densidad, esto implica
una movilización en la distribución que si bien
sigue concentrada alrededor de la moda, es más
dispersa respecto al año 2010 o 2012, por tanto
el tercer período se aprecia entre 2013-2016, al
mirar la gráca parecería que esta dispersión fue
hacia los niveles de menores ingresos, donde hay
un mayor ensanchamiento de la curva. Esto po-
dría estar relacionado con el aumento de la tasa
de empleo inadecuado (de acuerdo al INEC pasa
de 46.7% en 2014 a 53.4% en 2016).
• Al revisar otras medidas puntuales del ingre-
so como la variación porcentual de los ingresos
por cuantil (25). Al comparar cada año respec-
to al 2006 que es el año base para el análisis, se
comprueba que hay una mejora en el nivel de
los ingresos en general, pero sobre todo para los
primeros 10 cuantiles. Por otro lado, al analizar
la variación entre 2016 y 2014 se evidencia un
decrecimiento de la media de los ingresos, sobre
todo en primeros ocho cuartiles, mientras que
los cuartiles con mayores ingresos permanecen
prácticamente igual. Lo que también conrma-
ría la disminución de la densidad para 2016. Esto
podría indicar una pérdida en el bienestar. Estos
resultados en particular son consistentes con lo
reportado por la CEPAL (26), en el que se indica
que en hasta 2014 el incremento de los quintiles
más pobres fue mayor que el de los quintiles más
ricos, en tanto que para 2016 el ritmo de reduc-
ción de la desigualdad se ha desacelerado.
• Resaltan dos protuberancias, la que se encuen-
tra alrededor de la media y la mediana en cada
año, que concentra la mayor cantidad de perso-
nas y una pequeña protuberancia que se encuen-
tra en el intervalo [3.1,3.3] para 2006, [3.5,3.75]
para 2008-2010, y [3.6,4,1] en 2015-2016, que co-
rresponden a valores de USD 15 a USD 30, USD
35 y USD 50, respectivamente, lo que concuerda
con los valores pagados por concepto de Bono de
Desarrollo Humano, BDH en esos años; el gru-
po poblacional que se encuentra en esta agrupa-
ción está compuesta en su mayoría por mujeres,
73
también predomina el empleo en la categoría de
otro empleo no pleno y trabajo no remunerado
(categoría que de acuerdo al INEC también for-
ma parte de la población con empleo) y en vista
que se analiza el ingreso total, se incluye también
otras transferencias.
Figura 2. Función de densidad de los ingresos totales personales reales pe-
ríodo 2006-2016.
En cuanto al análisis de los estadísticos para pro-
bar la hipótesis nula, se obtuvieron los siguientes
resultados:
Comparación entre años
Pruebas Estadístico P – valor
KS 61791.6 <0.001
AD 5381 <0.001
Tabla 2. Estadísticos basados en la FDE
Comparación entre años
KDE Estadístico P-valor
L1,k 0.201 0.004
L,2k 0.012 0.996
Sk 0.124 0.004
AC 0.7186 0.001
Tabla 3. Estadísticos basados en la KDE
De acuerdo a esto se rechaza la hipótesis nula de
igualdad de la distribución de los ingresos en el
período 2006 – 2016. A excepción de la norma
L2 con la que se obtuvo un p valor de 0.99.
Análisis de la Homogeneidad de las Distribu-
ciones del Ingreso en el Período 2006-2016 por
Provincia.
Se contrastó las siguientes hipótesis:
H
0
=No existen cambios en la distribución de los
ingresos de la provincia i entre los años 2006 a
2016
H
1
= Existen cambios en la distribución de los in-
gresos de la provincia i entre los años 2006 a 2016
Donde i representa cada una de las provincias
analizadas siendo: Azuay (1), Bolívar (2), Cañar
(3), Carchi (4), Cotopaxi (5), Chimborazo (6), El
Oro (7), Esmeraldas (8), Guayas (9), Imbabura
(10), Loja (11), Los Ríos (12), Manabí (13), Pi-
chincha (17), Tungurahua (18) y la Amazonía
(30).
Para realizar un análisis gráco más detallado se
dividieron las provincias en dos grupos:
1: Azuay (1), Bolívar (2), Cañar (3), Carchi (4),
Cotopaxi (5), Chimborazo (6), El Oro (7) y Es-
meraldas (8).
2: Guayas (9), Imbabura (10), Loja (11), Los Ríos
(12), Manabí (13), Pichincha (17), Tungurahua
(18) y Amazonía (30).
Respecto a la primera agrupación se puede decir
que se aprecia la conformación de tres grupos.
En el primer grupo de provincias se destacan El
Oro y Azuay por ser las provincias que más con-
centración alrededor de la media presentan por
tanto son las menos desiguales y con los ingresos
más altos respecto al resto de provincias del gru-
po (una media de USD 500), el siguiente grupo lo
conforman: Cañar, Esmeraldas, Carchi y Coto-
paxi, que estarían un nivel medio, con ingresos
más bajos, ya que las curvas se desplazan a la iz-
quierda respecto al grupo anterior, nalmente se
tiene a las provincias de Bolívar y Chimborazo
que son las provincias que presentan mayor des-
igualdad e ingresos más bajos, el promedio de in-
gresos de Chimborazo para 2016 fue de USD 342
mientras que los de Azuay fueron de USD 511.
En el gráco a nivel de provincias, como en el
nivel nacional también se observa una segunda
protuberancia, en la que sobresale la provincia de
Chimborazo, como se aprecia en la gráca entre
las provincias comparadas es la que mayor canti-
dad de personas se encuentran alrededor del lo-
garitmo del [3.75] que representan alrededor de
USD 50, esto implica que hay un buen número
de personas en esta provincia que reciben trans-
ferencias monetarias distintas a los ingresos la-
borales.
Figura 3. Función de densidad de los ingresos totales personales reales pe-
ríodo 2006-2016 por provincia (Grupo 1).
Roldan, Flores, Cabezas
74
En el segundo grupo de análisis las provincias
con mayor concentración de personas alrededor
de la media son: Pichincha, Guayas y los Ríos,
de igual manera con el nivel más alto de ingresos
respecto al resto del grupo. Seguido por las pro-
vincias de Manabí, Tungurahua e Imbabura en
el medio, nalmente las provincias de la Amazo-
nía y Loja, que son las que presenta más disper-
sión y niveles de ingresos más bajos. La provin-
cia que sobresale en la segunda protuberancia es
la Amazonía, donde hay más concentración de
personas que perciben ingresos de alrededor de
USD 50 derivadas de transferencias monetarias
condicionadas. El gráco muestra las brechas en
la distribución de los ingresos (vista a través de
la diferencia de altura de las curvas), mientras el
promedio de ingresos de Pichinchas es de USD
642 el de la Amazonía es de USD 469.
Figura 4. Función de densidad de los ingresos totales personales reales pe-
ríodo 2016 por provincia (Grupo 2).
Los cambios en la forma, dispersión, localiza-
ción, aplastamiento de las curvas están de acuer-
do a los resultados presentados por el INEC (27),
se indica que al realizar un análisis por región
natural en el año 2006 la región Sierra es la que
más contribuye a la desigualdad (21,1 puntos o
55,8%), seguida de la región Costa (14,2 puntos
o 37,5%), la Amazonía (1,4 puntos o 3,8%), el
aporte de cada grupo a la desigualdad nacional
se mantiene para el año 2014.
Chimborazo es la provincia que en lugar de ha-
ber mejorado la distribución de su ingreso a te-
nido un retroceso, ya que la distribución traslado
su densidad hacia menores ingresos en 2016. La
mayor parte de los ocupados tienen una condi-
ción de ocupación en otro empleo no pleno, en
tercer lugar, se encuentran los trabajadores no
remunerados. La media de los ingresos de la pro-
vincia en el período analizado es de USD 300 in-
ferior al valor del salario básico unicado SBU de
2016 de USD 366.
Figura 5. Función de densidad de los ingresos totales personales reales pe-
ríodo 2006-2016 Chimborazo.
Lo observado a través de las curvas de densidad
del ingreso para las provincias del país está en
sintonía con lo encontrado por varios autores
que han realizado investigación a nivel territo-
rial. Las provincias más competitivas son Gua-
yas, Pichincha y Azuay y que concentran las tres
cuartas partes de la actividad económica del país
(28). En tanto que las menos competitivas son
Bolívar y la Amazonia, dado que las diferencias
competitivas no cambian en el corto plazo y en
la ausencia de externalidades fuertes estas dis-
crepancias se mantendrían en el corto y mediano
plazo.
Pichincha presenta las condiciones más adecua-
das para registrar menores niveles de desigual-
dad en el ingreso laboral ya que su estructura de
empleo es adecuada, con los menores niveles de
subempleo y desempleo y los retornos a la edu-
cación son crecientes de acuerdo a los niveles de
escolaridad (29). Existe mayor concentración de
capital humano en Pichincha, Napo, Galápagos,
también resaltan Santa Elena y El Oro que son las
ciudades que tienen mayor actividad económica,
lo que les permite insertarse a mejores puestos
laborales con mejores salarios (30).
Finalmente, Las provincias con mayor contri-
bución al índice de desigualdad de eil fueron
Pichincha por el lado de las ricas y Manabí por
el lado de las pobres y que en general, la ubica-
ción de las provincias en los diferentes rangos es
bastante estable en el tiempo, por lo que a pesar
que el índice a nivel nacional se ha reducido, las
provincias siguen manteniendo su estructura de
ricas y pobres a lo largo del tiempo (31).
A continuación, se presentan los resultados de
las pruebas aplicadas, basadas en FDE como
75
KDE para contrastar la hipótesis nula.
1 Azuay 3,000.09 <0.001 232.20 <0.001
2 Bolívar 4,189.43 <0.001 284.20 <0.001
3 Cañar 2,003.08 <0.001 211.20 <0.001
4 Carchi 7,614.05 <0.001 211.20 <0.001
5 Cotopaxi 2,783.03 <0.001 556.00 <0.001
6 Chimborazo 2,242.28 <0.001 461.60 <0.001
7 El Oro 7,798.88 <0.001 638.90 <0.001
8 Esmeraldas 6,399.82 <0.001 639.60 <0.001
9 Guayas 9,329.20 <0.001 1,209.00 <0.001
10 Imbabura 4,992.84 <0.001 515.30 <0.001
11 Loja 1,788.06 <0.001 253.50 <0.001
12 Los Ríos 4,399.73 <0.001 518.40 <0.001
13 Manabí 7,339.15 <0.001 1,397.00 <0.001
18 Pichincha 10,219.81 <0.001 951.50 <0.001
19 Tungurahua 5,490.35 <0.001 903.00 <0.001
20 Amazonia 3,022.08 <0.001 2,143.00 <0.001
Tabla 4. Pruebas basadas en la FDE por provincias.
Estadístico P - valor
Provincia Sk L1 L2 AC Sk L1 L2 AC
1 Azuay 0.115 0.544 0.158 0.760 0.038 0.222 0.234 0.000
2
Bolí-
var
0.133 0.411 0.020 0.710 0.000 0.126 0.040 0.000
3 Cañar 0.087 0.344 0.038 0.770 0.086 0.410 0.570 0.000
4 Carchi 0.125 0.347 0.019 0.640 0.000 0.268 0.232 0.000
5
Coto-
paxi
0.115 0.435 0.070 0.710 0.000 0.006 0.020 0.000
6
Chim-
bora-
zo
0.127 0.430 0.021 0.770 0.000 0.046 0.034 0.000
7 El Oro 0.619 0.759 0.374 0.620 0.110 0.104 0.116 0.000
8
Esme-
raldas
0.142 0.481 0.027 0.690 0.000 0.070 0.072 0.000
9
Gua-
yas
0.192 0.326 0.029 0.650 0.000 0.152 0.182 0.000
10
Imba-
bura
0.177 0.342 0.029 0.680 0.094 0.068 0.224 0.000
11 Loja 0.105 0.240 0.012 0.810 0.002 0.676 0.624 0.000
12
Los
Ríos
0.181 0.422 0.089 0.680 0.000 0.030 0.064 0.000
13
Ma-
nabí
0.190 0.477 0.065 0.650 0.000 0.128 0.038 0.000
17
Pi-
chin-
cha
0.165 0.733 0.050 0.600 0.000 0.128 0.296 0.000
18
Tun-
gura-
hua
0.113 0.353 0.014 0.700 0.000 0.368 0.294 0.000
30
Ama-
zonía
0.132 0.311 0.021 0.750 0.000 0.002 0.016 0.000
Tabla 5. Pruebas basadas en la KDE por provincias.
De acuerdo a los resultados obtenidos, las prue-
bas basadas en FDE en todos los casos rechazan
la hipótesis nula de la homogeneidad de las dis-
tribuciones, por su parte las pruebas basadas en
la KDE, el que tuvo una tasa de rechazo de la hi-
pótesis nula fue el estadístico AC, y el estadísti-
co Sk, por su parte la norma L1, la L2, también
rechazan la hipótesis nula las provincias cuya
distribución varía en su forma, como son Chim-
borazo y Cotopaxi. Como se vio en el análisis
gráco muchas de las distribuciones mantienen
la forma, pero presentan desplazamientos.
Análisis de la Homogeneidad de las Distribu-
ciones del Ingreso en el Período 2006-2016 por
Actividad Económica
Se contrastó las siguientes hipótesis:
H
0
=No existen cambios en la distribución
de los ingresos de la rama de actividad i entre los
años 2006 a 2016
H
1
= Existen cambios en la distribución
de los ingresos de la rama de actividad i entre los
años 2006 a 2016
Donde i representa cada una de las ramas de acti-
vidad analizadas siendo: Agricultura, ganadería,
caza, silvicultura y pesca (1), Industrias manufac-
tureras (2), Construcción (3), Comercio, repara-
ción de vehículos (4), Actividades de alojamiento
y servicio de comida (5), Administración públi-
ca, defensa y seguridad social (6), Enseñanza (7).
Partiendo del análisis gráco de la curva de den-
sidad de núcleo. En cuanto a la distribución de
la rama de Agricultura, ganadería, caza, silvi-
cultura y pesca, en general no ha cambiado su
forma, alcanza el pico más alto en 2008 (menor
desigualdad) y en 2016 es el año con menor con-
centración de densidad alrededor de la media
(aumento de la desigualdad), se visualizan dos
modas. Apenas el 20% de la población ocupada
en esta rama tiene empleo adecuado/pleno y el
36% se encuentra en otro empleo no pleno. Ade-
más, de acuerdo a la información reportada en la
Enemdu de diciembre 2016 el 78.5% de la pobla-
ción ocupada en la Agricultura se encuentra en
el área rural.
La dependencia de un sector agrícola poco pro-
ductivo de parte de algunos territorios pobres y
la polarización industrial en pocos cantones ri-
cos (Quito, Guayaquil y Cuenca), estaría contri-
buyendo a sostener la divergencia a nivel terri-
torial (32). Por otra parte, de acuerdo al Reporte
de pobreza por consumo (2016), publicado por
el INEC se concluye que la Agricultura sigue per-
diendo participación en el valor agregado y en la
Roldan, Flores, Cabezas
76
ocupación y por ser una rama de baja producti-
vidad laboral, la disminución de empleo de este
sector contribuye al aumento de la productividad
laboral total (33).
Figura 6. Función de densidad de los ingresos totales personales reales pe-
ríodo 2006-2016 , Agricultura, ganadería, caza, silvicultura y pesca.
La industria de la Manufactura también mantie-
ne una forma constante a lo largo de los once años
con ligeros desplazamientos a la derecha, pero en
general se mantiene estable. Para 2016 el 50.39%
de los ocupados en la Manufactura tienen un
empleo adecuado y el 62.35% se encuentra en el
sector formal (34). Por otra parte, de acuerdo al
Reporte de pobreza por consumo (27) del INEC,
la manufactura, no ha sido de las actividades más
relevantes para el país, más bien ha disminuido
su importancia en el valor agregado bruto y no se
ha alterado su contribución a la ocupación. Sin
embargo, su contribución neta al crecimiento del
PIB per cápita fue positiva debido fundamental-
mente al crecimiento de la productividad dentro
del sector.
La rama de la construcción es altamente con-
centrada alrededor de la media que no ha tenido
mayores desplazamientos, ligeramente se aprecia
una dispersión de la media de la distribución ha-
cia la derecha en el año 2016. En esta rama de
actividad mientras el 51% de personas ocupa-
das tiene una condición de empleo adecuado,
el 57.7% se encuentra en el sector informal
6
. El
INEC en su Reporte de pobreza por consumo
(27) determina que la construcción fue el sector
más dinámico en términos de su contribución
neta al crecimiento del PIB per cápita, debido
principalmente a un aumento de la productivi-
dad. Así también Larrea (34), concluye que el
producto por habitante de la construcción mues-
tra un comportamiento inestable con un perl
fuertemente pro-cíclico. En las fases de disponi-
bilidad de divisas, la construcción crece tanto por
____________________
6
Son aquellos que trabajan en unidades menores a 100 trabajadores que no tienen RUC. (INEC, 2018b).
la expansión de la inversión pública como por el
aumento de la demanda doméstica, y disminuye
fuertemente en períodos de crisis.
Al igual que las demás ramas de actividad el Co-
mercio se ha desplazado a la derecha, para 2016
presenta un aplastamiento y se visualiza la for-
mación de dos agrupaciones tanto hacia menores
ingresos como hacia mayores ingresos, siendo
esta última con mayor densidad, lo que sugiere
concentración hacia los ingresos más altos. Para
2016 aporto el 10.4% del VAB, ubicándose en
tercer lugar de importancia La mayor parte de
población ocupada en esta actividad se encuen-
tra en el área urbana para 2016 representó cerca
del 85%, solo el 37.9% se encuentra la ocupación
plena (34). El Comercio es una de las actividades
de menor productividad por debajo de la media
Nacional (20).
En las actividades de alojamiento también se
puede apreciar un desplazamiento a la derecha
con un aplastamiento en 2016. Como porcen-
taje del VAB a 2016 representa el 2.3%. El 83%
de los ocupados en esta rama de actividad se en-
cuentran en el área urbana, el 87% se encuentra
en el empleo inadecuado, los ocupados en esta
rama se encuentra distribuidos en proporciones
similares entre el sector formal (46%) e informal
(48%) (29). Desde 2001 la actividad turística es
importante para el país, mediante Decreto Ejecu-
tivo publicado en el Registro Ocial 309 de este
año, se establece como Política Prioritaria de Es-
tado el desarrollo del turismo en el país. El turis-
mo en el Ecuador representa el tercer ingreso no
petrolero para la economía.
En el proyecto del Ministerio de Turismo, Ecua-
dor Potencia Turística se identica como una de
las deciencias que tiene esta actividad, la falta
de planicación estratégica en el área de marke-
ting, tanto a nivel nacional como internacional
(35). Los servicios de Alojamiento se encuen-
tran dentro de los sectores de baja productividad
(20). Por su parte, en el Boletín de Indicadores
Turísticos del Ecuador de enero de 2017, se tiene
que entre enero y diciembre de 2016 se tuvo un
total de 1,412 millones de visitantes extranjeros,
con un decrecimiento de 8.5% respecto a 2015.
También para el cuarto trimestre de 2016 se tuvo
un total de 484,884 empleados en el sector lo que
representa un crecimiento de 11.7% respecto a
2015. Finalmente, el saldo de la balanza turística
77
para el tercer trimestre de 2016 fue de 292 mi-
llones de dólares con un decrecimiento de 31.7%
respecto también a 2015 (36).
La rama de administración pública y defensa
es la que tiene mayor concentración de la den-
sidad en niveles de ingresos superiores al resto
de ramas. Es una curva bastante simétrica lo que
indica menor desigualdad al interior del grupo.
Esto se puede explicar debido a que la mayoría
de servidores públicos se rigen mediante la Ley
Orgánica del Servicio Público, LOSEP, que nor-
ma sobre la escala de remuneraciones mensua-
les unicadas. En el Acuerdo Ministerial Nro.
MDT-2017-0154 del 22 de septiembre de 2017 se
establece un mínimo de USD 527 para el Servi-
dor Público de Servicios 1 y un máximo de USD
4,500 para el Servidor Público 16, Grado 22. Es
de las actividades que más registra ingresos al-
tos a diciembre de 2016 el promedio de ingresos
estuvo alrededor de los USD 1,123 el doble del
promedio nacional.
Por otro lado, se evidencia un punto de quiebre
en el número de instituciones públicas de 21.2%
entre 2006 y 2007 (37). Los autores también in-
dican que el gasto público (gasto corriente) entre
2007 y 2013 se ha incrementado en 194.9%. El
componente con mayor peso en el gasto públi-
co corriente son los Sueldos, que se han incre-
mentado en 140,9% en el período en mención.
Sin embargo, los autores a partir de su análisis
no pueden demostrar si el aumento se debe a un
incremento de burocracia (número de emplea-
dos) o de incrementos en sueldos y salarios, o su
proporción.
La actividad de la enseñanza es la que más cam-
bios en la forma ha tenido, en 2006 esa una curva
más simétrica mantiene el pico de la densidad al-
rededor de 0.7 hasta 2010, para 2014 y 2016 hay
un desplazamiento a la derecha (incremento de
los ingresos) y para 2016 es una curva con ma-
yor concentración alrededor de la media (mayor
igualdad), pero con una bimodalidad evidente.
El promedio de ingresos de esta rama de acti-
vidad también está sobre el promedio nacional
(USD 762 para 2016). La bimodalidad se puede
explicar por cuanto es una rama de actividad he-
terogénea, si se analiza desde el punto de vista
de la enseñanza para la educación inicial, general
básica y bachillerato y para la educación superior.
A partir de la vigencia de la Constitución de
2008, aprobada mediante referendo, la Educa-
ción en el país ha tenido cambios, algunos de los
cuales están relacionados o atados a temas nor-
mativos derivados de la aprobación tanto de la
Ley Orgánica de Educación Superior, LOES en
2010
7
como de la Ley Orgánica de Educación In-
tercultural Bilingüe, LOEI en 2011
8
. Dado que se
está analizando los cambios en la distribución de
los ingresos solo se hará mención a los aspectos
relacionados con las escalas de remuneración de
los docentes y sus cambios en el período anali-
zado.
El escalafón docente para los profesores de edu-
cación inicial, básica general y bachillerato está
normado en el Reglamento General a la LOEI
vigente desde 2012 y sus posteriores reformas.
En el Art. 301 de las Categorías del Escalafón do-
cente se indica que está estructurado por 7 ca-
tegorías con denominación alfabética desde la G
hasta la A y tienen equiparación en relación a las
escalas de la Ley Orgánica de Servicio Público.
La categoría G es equivalente a Servidor Público
1 (USD 817) y la categoría A, a Servidor Público
7 (USD 1,676). Las remuneraciones de los do-
centes antes de la re-categorización que se realizó
luego de la expedición de la Ley y sus reglamen-
tos eran menores, por ejemplo, un docente de
hasta 14 años de experiencia podía ganar hasta
USD 466,58, luego de 2012 hasta USD 817. Un
docente de hasta 45 años de experiencia ganaba
hasta USD 1,013.15, luego hasta USD 1,676, sin
embargo, también se indica que el salario por
hora disminuyó al cambiar de la jornada pedagó-
gica a la jornada de 40 horas semanales.
Por otro lado, el escalafón y escala remunerativa
del personal académico de las Universidades y
Escuelas Politécnicas esta normado por el Regla-
mento General a la LOES vigente desde octubre
de 2012. En el Artículo 46.- Escalafón y escala
remunerativa se expresan las categorías, niveles
y grados escalafonarios. Por ejemplo, al personal
académico titular principal /principal investiga-
dor a tiempo completo le corresponde en la escala
de remuneraciones del sector público un Grado
19 (USD 2,670). De acuerdo a una publicación
del Telégrafo antes un profesor principal ganaba
USD 1,281 y después del reglamento USD 2,967,
un auxiliar antes $481 y después USD 1,676 (38).
____________________
7
Mediante Registro Ocial Suplemento 298 del 12 de octubre de 2010.
8
Mediante Registro Ocial No.417 del 31 de marzo de 2011.
9
Decreto Ejecutivo 1241, publicado en el Suplemento del Registro Ocial No. 754 de 26 de julio de 2012.
Roldan, Flores, Cabezas
78
Figura 7. Función de densidad de los ingresos totales personales reales pe-
ríodo 2006-2016 , Enseñanza.
A continuación, en la Tabla 6 y Tabla 7 se presen-
tan los resultados de las pruebas para k muestras
aplicadas.
Actividad económica KS p - valor AD p valor
Agricultura, ganadería,
caza, silvicultura y pesca
18,409.90 <0.001 606.40 <0.001
Industrias manufactureras 5,902.12 <0.001 741.00 <0.001
Construcción 8,129.87 <0.001 938.30 <0.001
Comercio, reparación de
vehículos
5,231.76 <0.001 491.60 <0.001
Actividades de alojamiento
y servicio de comida
2,244.58 <0.001 220.10 <0.001
Administración pública,
defensa y seguridad social
3,219.87 <0.001 276.80 <0.001
Enseñanza 3,959.83 <0.001 530.50 <0.001
Tabla 6. Pruebas basadas en la FDE por rama de actividad económica.
Ramas de actividad
económica
Estadísticos p - valor
S L1 L2 AC S L1 L2 AC
Agricultura, gana-
dería, caza, silvicul-
tura y pesca
0.19 0.29 0.03 0.71 0.14 0.01 1 <0.001
Industrias manu-
factureras
0.24 0.88 0.73 0.68 0.97 0.13 0.28 <0.001
Construcción 2.14 7.85 71.4 0.60 0.49 0.01 0 <0.001
Comercio, repara-
ción de vehículos
0.12 0.21 0.01 0.77 0.7 0.21 1 <0.001
Actividades de alo-
jamiento y servicio
de comida
0.24 1.64 3.25 0.72 0.96 0.1 0 <0.001
Administración
pública, defensa y
seguridad social
0.22 2.87 2.28 0.70 0.99 0.64 0.79 <0.001
Enseñanza 0.47 3.46 0.93 0.66 0.97 0.42 0.92 <0.001
Tabla 7. Pruebas basadas en la KDE por rama de actividad económica
A. CÓDIGO DE PROGRAMACIÓN EN R DE LAS FUNCIONES PARA LA ESTI-
MACIÓN DE LOS ESTADÍSTICOS BASADOS EN KDE Y FDE.
Función para construir la densidad
# x: muestra de tamaño n1
# tipo.rango=c("kde","x")
epdf <- function(x, tipo.rango, ...) {
bol <- is.na(x)
if(any(bol))
{
x <- x[!bol]
}
kde <- density(x,...)
f<-splinefun(kde$x, kde$y)
res <- switch(tipo.rango,
"kde" = list(f = f, n = length(x), min = min(kde$x),
max = max(kde$x)),
"x" = list(f = f, n = length(x), min = min(x), max = max(x)))
return(res)
}
# x: una muestra de tamaño n1
# y: una muestra de tamaño n2
distanciaL1<-function (x, y, ...)
{
# Obtenemos el rango común a evaluar
m<-min(min(x),min(y))
M<-max(max(x),max(y))
pdf_i<-epdf(x,tipo.rango="x")
pdf_n<-epdf(y,tipo.rango="x")
soporte <- seq(m, M, length.out = 10000)
# obtenemos la distancia
d <- abs(pdf_i$f(soporte) - pdf_n$f(soporte))
# construimos la funci?n distancia
f <- splinefun(soporte, d)
res <- list(f = f)
return(res)
}
distanciaL2<-function (x, y, ...)
{
# Obtenemos el rango común a evaluar
m<-min(min(x),min(y))
M<-max(max(x),max(y))
pdf_i<-epdf(x,tipo.rango="x")
pdf_n<-epdf(y,tipo.rango="x")
soporte <- seq(m, M, length.out = 10000)
# obtenemos la distancia
d <- (pdf_i$f(soporte) - pdf_n$f(soporte))^2
# Construimos la función de distancia
f <- splinefun(soporte, d)
res <- list(f = f)
return(res)
}
distanciaS<-function (x, y, ...)
{
# Obtenemos el rango común a evaluar
m<-min(min(x),min(y))
M<-max(max(x),max(y))
pdf_i<-epdf(x,tipo.rango="x")
pdf_n<-epdf(y,tipo.rango="x")
soporte <- seq(m, M, length.out = 10000)
# obtenemos la distancia
d <- max(abs(pdf_i$f(soporte) - pdf_n$f(soporte)))
# construimos la función distancia
f <- d
res <- list(f = f)
return(res)
}
distancia <- function(x,y,type){
res <- switch(type,
"L1"={distanciaL1(x,y)},
"L2"={distanciaL2(x,y)},
"S"={distanciaS(x,y)}
)
return(res)
}
# x: función a integral denida entre m y M
# m: límite inferior de la integral
# M: límite superior de la integral
## Aproximación de la integral por una suma
int.sum <- function(x, m, M, ...){
soporte <- seq(m, M, length.out = 10000)
delta <- soporte[2]- soporte[1]
Isum <- delta * sum(x(soporte))
res <- list(value = max(Isum))
return(res)
}
# sub.m: una lista de muestras a calcular los p. valores
# total.m: muestra completa
estadistico<-function(sub.m,total.m,type="L1"){
# str(lapply(sub.m, is.na))
for ( i in 1:length(sub.m))
{
bol <- is.na(sub.m[[i]])
if(any(bol))
{
sub.m[[i]] <- sub.m[[i]][!bol]
}
}
bol <- is.na(total.m)
79
if(any(bol))
{
total.m <- total.m[!bol]
}
dist<-sapply(sub.m,distancia,total.m,type)
int.f<- if (type!="S") sapply(dist,int.sum,min.rango,max.rango)
n.v<-sapply(sub.m,length)
n <- sum(n.v)
est<-ifelse(type=="S",sum(mapply("*",unlist(dist),n.v))/n,
sum(mapply("*",unlist(int.f),n.v))/n)
res<-list(estadistico=est,n.muestra=n.v,n)
return(res)
}
# xdatos: muestra agrupada
# n.v: vector de tamaños muestrales
# B: número de replicas
dist.est<-function(xdatos,n.v,B,type="L1"){
k<-length(n.v)
n<-length(xdatos)
h<-n^(-1/5)
datos.boot<-list()
estadistico.boot<-vector()
set.seed(1234)
for (b in 1:B) {
x.boot<-sample(xdatos,replace=T)+h*rnorm(n)
for (i in 1:k){
datos.boot[[i]]<-sample(x.boot,n.v[i])
}
estadistico.boot[b]<-estadistico(datos.boot,x.boot,type=type)$estadistico
}
res<-unlist(estadistico.boot)
return(res)
}
FUNCIONES PARA LA ESTIMACIÓN DEL ESTADÍSTICO DE KOLMOGO-
ROV – SMIRNOV
### Permuta k muestras.
#Input: data list Y, muestras x1, x2 … xn
#Output: list de muestras de datos permutadas
permutek <- function(Y, ...){
k <- length(Y)
N <- lapply(Y, length)
Y <- unlist(Y)
X <- sample(Y, replace = FALSE)
res <- list()
Nt <- 0
for(i in 1:k){
Nt <- Nt+N[[i]]
res[[i]] <- X[((Nt-N[[i]])+1):Nt]
}
class(res) <-"permute3"
return(res)
}
## Calcula la distancia de Kolmogorov-Smirnov entre k FDE ( ECDF).
##Input: data muestras x1, x2 … xn
##Output: la x distancia KS
testks <- function(Y){
## Distribución conjunta
k <- length(Y)
N <- lapply(Y, length)
X <- unlist(Y)
## Encuentra la función acumulada
tt <- seq(min(X), max(X), by = 0.01)
FX <- ecdf(X)
d <- vector()
for(i in 1:k){
Fx <- ecdf(Y[[i]])
d <- c(d,sum(N[[i]]*((Fx(tt) - FX(tt))^2)))
}
## statistics
D <- max(d)
##return results
res <- list(D = D)
class(res) <- "testks"
return(res)
}
#perm<-1000
# Y=x
## Calcula el p-valor luego del "perm" permutationes
## Input: data muestras x1, x2, xn y el número de permutaciones.
## Output: list of p-values. KS,
Pvalue <- function(Y, perm){
areaKS <- numeric(perm)
antalKS <- numeric(0)
Dobs <- testks(Y)$D
for (i in 1:perm){
X <- permutek(Y)
areaKS[i] <- testks(X)$D
}
antalKS <- sum(areaKS >= Dobs)
pKS <- (antalKS)/(perm)
res <- list(pKS = pKS, dist = areaKS, D = Dobs)
class(res) <- "Pvalue"
return(res)
}
FUNCIONES PARA LA ESTIMACIÓN DEL ESTADÍSTICO AC
## Calcula el estadístico AC entre k KDE
##Input: data muestras x1, x2 … xn
##Output: estadístico AC
testAC <- function(Y, ip.method = c("linear", "spline"),
spline.type = c("natural", "fmm", "periodic", "monoH.FC"),
grid.size = 10000, subdivisions = 500,
tol = .Machine$double.eps^0.5, ...) {
if (!is.list(x))
stop("x must be an object of class ", sQuote("list"))
ip.method <- match.arg(ip.method)
spline.type <- match.arg(spline.type)
## Interpolation
interpolate <- switch(ip.method,
"linear" = function(x, y) {
f <- approxfun(x, y, yle = 0, yright = 0)
return(f)
},
"spline" = function(x, y) {
f <- splinefun(x, y, method = spline.type)
return(f)
})
## Estimación de la función de densidad de probabilidad
epdf <- function(x, range.type = c("kde", "x"), ...) {
range.type <- match.arg(range.type)
## Función de densidad
kde <- density(x, ...)
f <- interpolate(kde$x, kde$y)
res <- switch(range.type,
"kde" = list(f = f, n = length(x), min = min(kde$x),
max = max(kde$x)),
"x" = list(f = f, n = length(x), min = min(x), max = max(x)))
return(res)
}
## Función de distancia
distance <- function(x, ...) {
pdf_i <- lapply(x, epdf)
xMin <- min(sapply(pdf_i, function(x) x$min))
xMax <- max(sapply(pdf_i, function(x) x$max))
support <- seq(xMin, xMax, length.out = grid.size)
d <- apply(sapply(pdf_i, function(pdf_i) pdf_i$f(support)), 1, min)
f <- interpolate(support, d)
supportRange <- range(support)
res <- list(f = f, min = supportRange[1], max = supportRange[2])
return(res)
}
## Integración
intbysum <- function(x, m, M, ...){
#Isum <- numeric(0)
support <- seq(m, M, length.out = grid.size) #0.0001)
delta <- support[2]- support[1]
Isum <- delta * sum(x(support))
## Return results
res <- list(value = max(Isum))
#class(res) <- "intbysum"
return(res)
}
## Cálculo de las distancias entre distribuciones
d <- distance(x)
## integrate(d$f, d$min, d$max, subdivisions = subdivisions)$value
#integrate(d$f, -Inf, Inf, subdivisions = subdivisions)$value
D <- intbysum(d$f, d$min, d$max)$value
return(res = list(D= D))
}
# Permuta k muestras.
#Input: data list Y, muestras x1, x2 and xn
#Output: list of muestras de datos permutados
#Y=x
permutek <- function(Y, ...){
k <- length(Y)
N <- lapply(Y, length)
Y <- unlist(Y)
X <- sample(Y, replace = FALSE)
res <- list()
Nt <- 0
for(i in 1:k){
Nt <- Nt+N[[i]]
Roldan, Flores, Cabezas
80
res[[i]] <- X[((Nt-N[[i]])+1):Nt]
}
class(res) <-"permute3"
return(res)
}
##Calcula el p - valor
PvalueAC <- function(Y, perm=1000){
areaAC <- numeric(perm)
antalAC <- numeric(0)
Dobs <- testAC(Y)$D
for (i in 1:perm){
x <- permutek(Y)
areaAC[i] <- testAC(x)$D
}
antalAC <- sum(areaAC <= Dobs)
pAC <- (antalAC)/(perm)
res <- list(pAC = pAC,dist = areaAC, D = Dobs)
class(res) <- "Pvalue"
return(res)
}
IV. CONCLUSIONES
Las hipótesis planteadas sobre vericar si existen
diferencias en la distribución del ingreso a nivel
de provincias y actividades económicas en el pe-
ríodo 2006-2016., con base en los resultados, se
puede indicar que estas se han cumplido.
De acuerdo a la aplicación de pruebas para veri-
car la hipótesis de normalidad de la distribución
de ingresos personales tanto por provincia como
actividad económica, se obtuvo como resultado
que se rechaza a hipótesis nula, en todos los casos
el p valor es menor a 0.05, por tanto, la distribu-
ción de ingresos es diferente de la Normal.
La aplicación de métodos no paramétricos para
el análisis de distribuciones que se alejan de los
supuestos de la normal, es adecuada para el caso
de la distribución de los ingresos personales ya
que sus formas presentan asimetrías y en algunos
casos más de una moda.
La experiencia de aplicación de pruebas de bon-
dad de ajuste basadas en la Función de Distribu-
ción Empírica que tradicionalmente se han utili-
zado así como la aplicación de pruebas basadas
en la función de densidad KDE, como método
alternativo y de desarrollo más reciente, han per-
mitido vericar los hallazgos encontrados por
Martínez y Baranzano (14), en cuanto a que las
pruebas basados en KDE tienen más potencia
cuando se trata de distribuciones que dieren en
su forma en tanto que los basados en FDE fun-
cionan mejor cuando las distribuciones dieren
en su localización. En el caso de Ecuador los
cambios en el tiempo de la distribución del in-
greso corresponden a esta última característica.
En este sentido se ha podido concluir que las
pruebas basadas en FDE funcionan mejor para
el caso de la distribución del ingreso del país. Y
la prueba basada en KDE que mejor desempeño
tuvo fue el estadístico AC y en menor medida la
norma L1 lo que también se corrobora con la evi-
dencia empírica.
En cuanto a la distribución de los ingresos se ha
podido vericar tanto a partir del análisis gráco
como de los resultados de las pruebas implemen-
tadas que efectivamente durante el período 2006
- 2016 ha habido cambios en la distribución del
ingreso, que si bien han tenido un desplazamien-
to sostenido hacia la derecha, en los dos últimos
años se evidencia un cambio en la concentración
de la densidad de niveles superiores a niveles infe-
riores, en los que mayoritariamente hay un aplas-
tamiento de la curva lo que implica aumento de
la desigualdad y consecuentemente un aumento
en los niveles de pobreza. A partir de este análisis
se ha podido conrmar que en el país persiste la
desigualdad en el desarrollo territorial, las pro-
vincias que tradicionalmente presentan mayores
niveles de pobreza y desigualdad, en los indica-
dores puntuales, son las mismas que tienen cur-
vas de distribución más asimétricas y con con-
centraciones de población en los ingresos más
bajos, siendo el caso de Chimborazo, el que más
llama la atención por su marcado deterioro en la
distribución del ingreso. En tanto que las provin-
cias de Pichincha, Guayas y Azuay son las que
presentan mejores niveles de ingresos y distribu-
ciones menos concentradas. Por lo tanto, están
en mejores condiciones que el resto del país en
términos de la distribución del Ingreso. En cuan-
to a las ramas de actividad económica del análisis
se desprende que, si bien se ha probado que hay
cambios en la distribución en cuanto a su forma,
esta se mantiene estable, igualmente se observa-
ron cambios en la localización y la magnitud. El
caso de la actividad de enseñanza es la que ha te-
nido el cambio más notorio, en parte se ha expli-
cado que estos cambios están inuenciados por
la aplicación del escalafón docente que consta en
los reglamentos de la LOEI y LOES. Por tanto,
los patrones de especialización no han cambia-
do, al igual que los niveles de ingresos que siguen
siendo bajos en el sector primario, han mejorado
en el sector de la construcción que como se indi-
có es un sector pro-cíclico y se mantienen en el
rango más alto la enseñanza y las actividades de
administración pública.
81
1 Dagum C. A New Model of Personal Income-Distribution-Specification and Estimation. Eco-
nomie Appliquée. 1997; 30(1): 413-437.
2 Singh S, Maddala G. A Function for Size Distribution of Incomes. Econometrica. 1976; 44(5):
963-970.
3 Pittau M, Zelli R. Trends in income distribution in Italy: A non parametric and semi-parame-
tric analysis. Journal of Income distribution. 2006; 15(1): 90-118.
4 Flores A. Distribución del ingreso en México 1984-2006: Repercusión en las clases sociales
[Tesis de Post-grado]. México: Universidad Aunoma de Nuevo León; 2009. Recuperado a partir de:
http://eprints.uanl.mx/id/eprint/1919
5 Kiefer J. K-sample analogues of the Kolmogorov-Smirnov and Cramer-V. Mises Tests. The
Annals of Mathematical Statistics. 1959; 2(1): 420-447.
6 Camblor M, Carlos P, Corral N. Sobre el estadístico de Cramér-von Mises. Revista de Matemá-
tica: Teoría y Aplicaciones. 2012; (1)1: 89-101.
7 Gasparini L, Cicowiez M, Escudero S. Pobreza y Desigualdad en América Latina. Conceptos,
herramientas y aplicaciones. 1era Edición. La Plata: CEDLAS-Universidad Nacional de La Plata; 2013.
8 Cowell F. Measurement of Inequality. Handbook of income distribution. 1st Edition. London:
London School of Econoics and Political Science; 2000.
9 Fix E, Hodges J. Discriminatory Analysis, Nonparametric Discrimination: Consistency Pro-
perties. 1era Edición. Texas: USAF School of Aviation Randolph Field; 1951.
10 Rosenblatt M. Remarks on some nonparametric estimates of a density function. Annals of
Mathematical Statistics. 1956; 27(3): 832-837.
11 Burkhauser P, Cutts C, Daly A, Jenkins S. Testing the significance of income distribution chan-
ges over the 1980 business cycle: a cross-national comparison. Journal of Applied Econometrics. 1999;
14(3): 253-272.
12 Liu Y, Zou W. Rural–urban Migration and Dynamics of Income Distribution in China: A Non–
parametric Approach. China & World Economy [Internet]. 2011 [10 Jul 2017]; 19(6): 37–55. Disponi-
ble en: https://onlinelibrary.wiley.com/doi/10.1111/j.1749-124X.2011.01265.x
13 Nonovsky N, Tochkov K. Transition, Integration and Catching Up: Income Convergence be-
tween Central and Eastern Europe and the European Union. Mondes en développement [Internet].
2014 [10 Jul 2017]; 3(167): 73- 92. Disponible en: doi:10.3917/med.167.0073.
14 Baranzano R. Non-parametric kernel density estimation-based permutation test: Implementa-
tion and comparisons. 1era. Edición. Suecia: Deartament of Mathematics Uppsala University; 2011.
15 Zhu F. A nonparametric analysis of the shape dynamics of the US personal income distribu-
tion: 1962-2000. BIS Working Papers. 1st Edition. Suiza: Monetary and Economic Department of the
Bank for International Settlements; 2005.
16 Wand MP, Marron JS, Ruppert D. Transformations in density estimation. Journal of the Ame-
rican Statistical Association. 1991;1(86):343-361.
17 Scholz F, Zhu A. kSamples: K-Sample Rank Tests and their Combinations. R package ver-
sion 1.2-9. [Internet]. CRAN R: CRAN R; 2019 [Consultado 03 Jul 2019]. Disponible en: https://
CRAN.R-project.org/package=kSamples.
18 Comisión Económica para América Latina y el Caribe-CEPAL. Panorama Social de América
Latina 2017. 1era. Edición. Santiago: (LC/PUB.2018/1-P); 2018.
19 SICES [Internet]. Sistema Integrado de Conocimiento y Estadística Social del Ecuador. SICES
2018 [03 Agosto 2018]. Disponible en: http://www.conocimientosocial.gob.ec.
20 León M. Diagnóstico y perspectiva de la economía ecuatoriana en 2016. 1era. Edición. Quito:
Friedrich-Ebert-Stiftung (FES). Instituto Latinoamericano de Investigaciones Sociales (ILDIS); 2016.
21 Gross J, Ligges U. nortest: Tests for normality. R package version 1.0-4. [Internet]. CRAN R:
CRAN R; 2015 [Consultado 03 Jul 2018] Disponible en: https://CRAN.R-project.org/package=nortest.
22 Gavrilov I, Pusev R. normtest: Tests for normality. R package version 1.1. [Internet]. CRAN R:
CRAN R; 2014 [Consultado 03 Ago 2014] Disponible en: https://CRAN.R-project.org/package=nor-
mtest.
eferencias
R
Roldan, Flores, Cabezas
82
23 Contreras D. Pobreza y Desigualdad en Chile: 1987-1992. 1era Edición. Chile: Estudios Públi-
cos; 1996.
24 Sarmiento M. Evolución de la desigualdad de ingresos en Ecuador, período 2007-2015. Revista
de análisis estadístico Analítika. 2017;13(1): 49-79.
25 Gachet I, Grijalva D, Ponce P, Rodríguez D. Vertical and Horizontal Inequality in Ecuador: The
Lack of Sustainability. Social Indicators Research. [Internet] 2019 [12 Agosto 2017]. 1(145): 861-900.
Disponible en: https://doi.org/10.1007/s11205-017-1810-2.
26 Comisión Económica para América Latina y el Caribe-CEPAL. Panorama Social de América
Latina 2017. Comisión Económica para América Latina y el Caribe: Santiago: (LC/PUB.2018/1-P);
2018.
27 Instituto Nacional de Estadísticas y Censos. Reporte de pobreza por consumo Ecuador 2006 -
2014. INEC. Quito: Estudios Temáticos; 2016.
28 Alvarado R. Measuring the competitiveness of the provinces of Ecuador. Universidad Católica
del Norte. MPRA Paper. [Internet] 2011 [12 Agosto 2017]. 1(34244): 1-19. Disponible en: https://mpra.
ub.uni-muenchen.de/id/eprint/34244.
29 Mena A. Desigualdad salarial en las provincias del Ecuador [Tesis de maestría]. Quito: Fa-
cultad Latinoamericana de CIencias Sociales sede Ecuador; 2013 Recuperado de: http://hdl.handle.
net/10469/7427.
30 Ayala N. Capital humano e ingreso laboral en Ecuador: un enfoque regional utilizando varia-
bles instrumentales. Revista Económica Universidad de la Rioja [Internet] 2016 [12 Agosto 2017]. 1(1):
1-11. Disponible en: https://revistas.unl.edu.ec/index.php/economica/article/view/191
31 Proaño M. Descomposición regional de la desigualdad en Ecuador [Tesis de maestría]. Quito:
Facultad Latinoamericana de CIencias Sociales sede Ecuador; 2012. Recuperado de: https://reposito-
rio.flacsoandes.edu.ec/xmlui/handle/10469/8880
32 Mendieta-Muñoz R. La hipótesis de la convergencia condicional en Ecuador. Un análisis a
nivel cantonal. Revista Retos [Internet] 2015 [12 Agosto 2017]. 5(9): 13-25. Disponible en: https://doi.
org/10.17163/ret.n9.2015.01
33 Instituto Nacional de Estadísticas y Censos-INEC. Ecuador en cifras Encuesta Nacional de
Empleo, Subempleo y Desempleo. ENEMDU [Internet]. Ecuador en cifras: INEC; 2016 [12 de Ene
2017]. Disponible en: https://www.ecuadorencifras.gob.ec/enemdu-2016.
34 Larrea C. Petróleo, pobreza y empleo en el Ecuador: de la bonanza a la crisis. En R. D. Hans-Jür-
gen Burchardt, Nada dura para siempre. Neo-extractivismo tras el boom de las materias primas. 1era
Edición. Quito: Abya-Yala; 2016.
35 Altamirano B, Gutiérrez M, Gonzáles K. Comunicación Turística 2.0 en Ecuador. Análisis de
las empresas públicas y privadas. Revista Latina de Comunicación Social. 2018; 1(73): 633 - 647.
36 Ministerio de Turismo. Indicadores Turísticos: Información relevante del Turismo en Ecuador;
Ministerio de Turismo [Internet]. Turismo en cifras: Ministerio de Turismo; 2017 [31 Enero 2017]
Disponible en: https://servicios.turismo.gob.ec/descargas/Turismocifras/Publicaciones/Boletines-
MensualesTurismo/2017/01-INDICADORES_TURISTICOS-ENERO-2017.pdf.
37 Alba J, Umpierrez S. Evolución del sector público ecuatoriano desde 1998 a 2013. Revista En-
foques. 2014; (12)21:131-148.
38 Un docente universitario gana ahora $ 2.967 (Infografía). El Telégrafo [Internet]. 2015 [cita-
do 15 octubre 2016]; https://www.eltelegrafo.com.ec/noticias/sociedad/4/un–docente–universitario–
gana–ahora–2–967–infografia. Disponible en: https://www.eltelegrafo.com.ec/noticias/sociedad/4/
un-docente-universitario-gana-ahora-2-967-infografia.