14
ISSN 2477-9105
Número 28 Vol.1 (2022)
DOI: https://doi.org/10.47187/perf.v1i28.173
Universidad Nacional Agraria la Molina, Facultad de Economía y Planicación, Departamento
de Estadísca e Informáca, Lima, Perú.
*jgamboa@lamolina.edu.pe
Esta invesgación aborda el uso de la distribución geométrica con datos censurados aleatoriamente. El
conjunto de datos, proporcionado por la Universidad Nacional Agraria La Molina (UNALM), corresponde
a postulantes durante los años 2018 al 2021, de quienes se registró si lograron el ingreso o no. Los
datos se censuraron aleatoriamente y se consideró que una censura se presenta cuando el postulante
no ingresó y no postuló más. Los parámetros que se esmaron fueron la probabilidad de que ingrese
el postulante y la probabilidad de que desista en sus intentos, la cual vendría a ser la probabilidad de
censura. Ambas candades fueron esmadas con el método de máxima verosimilitud y también los
intervalos de conanza fueron obtenidos a parr la matriz de información de Fisher. Así, se encontró
que la probabilidad de ingresar a la universidad es 0,117, y esta es mayor en hombres. Además, se
esmó una probabilidad de censura igual a 0,296.
Palabras Clave: Admisión, censura aleatoria, probabilidad de ingreso, probabilidad de abandono,
distribución discreta.
This research deals with the geometric distribuon with randomly censored data. The data set,
provided by the Universidad Nacional Agraria La Molina (UNALM), corresponds to applicants during
the years 2018 to 2021, for whom it was recorded whether they achieved admission or not. Data was
randomly censored, and it was considered that a censorship was presented when the applicant did
not enter and did not apply again. The esmated parameters were the probability that the applicant
would enter and the probability that he would give up his aempts, which would be the probability of
censorship. Both quanes were esmated with the maximum likelihood method and the condence
intervals were obtained from the Fisher informaon matrix. Thus, it was found that the probability of
entering the university is 0,117, and this is higher in men. In addion, a probability of censorship was
esmated as 0,296.
Keywords: Admission, random censorship, probability of admission, probability of abandonment,
discrete distribuon.
LA DISTRIBUCIÓN GEOMÉTRICA CENSURADA APLICADA A
DATOS DE POSTULANTES A LA UNIVERSIDAD NACIONAL
AGRARIA LA MOLINA.
RESUMEN
ABSTRACT
Geometric censored distribuon applied to data of applicants
to the Universidad Nacional Agraria La Molina.
Clodomiro Fernando Miranda Villagómez
Jesús Eduardo Gamboa Unsihuay*
Fecha de recepción: 20-12-2021 Fecha de aceptación: 10-02-2022 Fecha de publicación: 01-08-2022
ISSN 2477-9105
Número 28 Vol.1 (2022)
DOI: https://doi.org/10.47187/perf.v1i28.173
iD
iD
15
LA DISTRIBUCIÓN GEOMÉTRICA CENSURADA APLICADA A DATOS DE
POSTULANTES A LA UNIVERSIDAD NACIONAL AGRARIA LA MOLINA.
Miranda, Gamboa
I. INTRODUCCIÓN
Existen estudios de empo de vida que pueden
tener un alto costo de empo y dinero, de modo
que para no incurrir en ese alto costo se suele
considerar una censura intencional o aleatoria.
Hay varios pos de censura: por la izquierda, por
la derecha, po I, po II, y aleatoria. Se dice que
se da por la izquierda cuando el suceso ya ocurrió
antes ingresar al estudio, pero no se sabe hace
cuánto empo, siendo poco frecuente este po
de censura. Cuando se da por la derecha lo que se
sabe es que, de haber ocurrido el evento, este se
presentaría después del empo observado, siendo
esta la situación de censura más común.
La censura po I se presenta cuando se ha
jado un empo máximo de observación de un
evento, entonces los individuos que al término
de este empo ximo de observación no
hayan presentado el evento son considerados
como observaciones censuradas. Por otro lado,
la censura po II ocurre cuando el invesgador
decide aumentar la observación de los individuos
hasta que ocurran k eventos de n posibles (k ≤ n);
una razón para determinar el número de eventos
que deben observarse es la potencia que se
requiere para el estudio, así los individuos que no
presentan el evento cuando se han completado las
k primeras observaciones, son considerados como
censurados.
A diferencia de las censuras po I y po II, que son
controladas por el invesgador, la censura po III
o aleatoria, ocurre sin su control (1-3), pudiendo
presentarse por abandono del individuo, y en
consecuencia se le pierde el seguimiento, o
por muerte dada alguna causa no relacionada
al evento de interés; esto úlmo aplica para
estudios de supervivencia. “La censura aleatoria
es una situación en la que un elemento en
estudio se pierde o se elimina aleatoriamente del
experimento antes de que falle. En otras palabras,
algunos sujetos del estudio no han experimentado
el evento de interés al nal del estudio. En un
estudio social, algunos sujetos se pierden durante
el seguimiento en la mitad de la encuesta” (4).
Además, “en los experimentos de la vida real, nos
encontramos con situaciones en las que los datos
del empo de falla son discretos, ya sea a través
de la agrupación de datos connuos debido a
una medición imprecisa o porque el empo en
es discreto, por ejemplo, días, semanas o meses.
En tales circunstancias, se mide la vida úl de un
disposivo en una escala discreta. Un modelo de
vida úl discreto también puede considerar el
número de ciclos, pruebas u operaciones exitosas
antes de la falla de un disposivo. En los modelos
de vida úl discretos, la distribución geométrica de
un parámetro ene una posición importante” (5).
La variable aleatoria discreta (v.a.d.) Geométrica X se
dene como el número de fracasos previos al primer
éxito en una secuencia de pruebas de Bernoulli donde
π=P("Éxito" )" y " 1-π=P("Fracaso" ) (6-7), además la
función de probabilidad de la v.a.d. es:
Así, puesto que X~Geométrica (π) entonces:
Además, la distribución acumulada de la variable
geométrica viene dada por:
Se pueden citar invesgaciones que han hecho
uso de la distribución geométrica censurada,
por ejemplo abordando la esmación de los
parámetros de la distribución geométrica con
censura po I, mediante inferencia clásica (8), o
a través del desarrollo de modelos de regresión
para datos de conteo, incluyendo censuras en las
distribuciones Poisson y Binomial Negava, siendo
la geométrica un caso parcular de esta úlma, a
n de esmar el número de años que transcurren
desde que se lanza una tecnología y esta es
adoptada por las personas (9).
Desde otro ángulo, se uliza una mixtura de
distribuciones geométricas censuradas a la derecha
para modelar distancias en datos de genomas
(10). Una aplicación disnta de la distribución
geométrica censurada consiste en emplearla para
esmaciones en modelos de captura recaptura
(11). También existe el modelo de regresión
binomial negava (que es el caso general de la
distribución geométrica) Hurdle con datos de
conteo censurados a la derecha (12).
Por su parte, la aplicación de la distribución
geométrica censurada en registros históricos de
exámenes de ingreso a la universidad no ha sido
abordada. Se ha reportado que la parcipación
connua en exámenes de ingreso ejerce una
presión considerable sobre los postulantes de
bajo rendimiento, lo que inuye en sus eslos de
(1)
(2)
(3)
16
ISSN 2477-9105
Número 28 Vol.1 (2022)
DOI: https://doi.org/10.47187/perf.v1i28.173
aprendizaje y futuro perl profesional (13). Desde
un punto de vista psicológico, ha sido señalado
que, entre quienes reprobaron el examen de
ingreso, presentaron mayor sasfacción en sus
vidas aquellos que desarrollaron un control de
compensación secundaria, dicho de otro modo,
desisr un objevo puede ser más adaptavo que
esforzarse de forma persistente (14). Por otro lado,
se ha encontrado que a medida que se rinden más
exámenes de admisión, el uso de estrategias de
evitación es menos frecuente (15).
La candad de postulaciones está asociada
directamente con la resiliencia e inteligencia
emocional del postulante (16), por lo que conocer
la dinámica del número de postulaciones es de
ulidad para ofrecer un servicio de orientación
psicopedagógica en las charlas vocacionales
de carreras universitarias, a n de no generar
desmovación, confusión, baja autoesma y, en
consecuencia, un exiguo rendimiento académico.
Además, la preparación para el ingreso a la
universidad conlleva un costo en empo y dinero:
el 37% de los postulantes a una universidad
pública se preparó más de un año para postular
a la universidad, siendo este porcentaje superior
en varones, y de manera parcular, el empo de
preparación para la UNALM es uno de los más
altos, pues el 57% lo realiza durante más de un
año, con un gasto mensual promedio que uctúa
entre 1000 y 2000 soles (17).
Esta situación debe movar a las autoridades
universitarias, de modo que aprovechen la
potencial fortaleza de resiliencia e inteligencia
emocional en los nuevos estudiantes y las
refuercen en aquellos nuevos estudiantes que lo
requieran, siendo esta una manera de retribuir
los esfuerzos por el ingreso a la universidad. Esta
situación cobra mayor relevancia en el escenario
de la pandemia por COVID-19, pues el aislamiento
social y la soledad han causado un deterioro en la
salud mental de niños y adolescentes (18), siendo
relevante este úlmo grupo en los exámenes de
admisión de la UNALM pues representa al menos
el 30% del total de postulantes.
En este contexto, se presenta una aplicación de
la distribución geométrica con datos censurados
aleatoriamente al histórico de postulación e
ingreso de los aspirantes a la Universidad Nacional
Agraria La Molina (UNALM) en los ciclos 2018-
2 al 2021-1. Cabe resaltar que un postulante en
los ciclos mencionados pudo haber intentado
el ingreso en períodos previos como el 2018-1 o
durante el 2017. Se considera que un dato está
censurado aleatoriamente cuando la persona
desisó de postular y por ello no logró el ingreso
a la universidad. El ingreso a la universidad se da
entre quienes aprueban un examen de admisión y
alcanzan una vacante por orden de mérito.
El objevo de esta invesgación consiste en esmar
de forma puntual y por intervalos la probabilidad de
ingreso a la universidad, así como la probabilidad
de censura, ulizando la distribución geométrica,
en postulantes a la UNALM en los ciclos 2018-2 al
2021-1. El método de esmación ulizado es el de
máxima verosimilitud (19-21).
II. MATERIALES Y MÉTODOS
La población de postulantes a la UNALM durante
los ciclos 2018-2 al 2021-1 ascendió a N=9675.
Fueron excluidos los registros de ingreso directo
por el Centro Pre Universitario. A n de realizar la
esmación de parámetros de las distribuciones se
extrajo una muestra de tamaño n=4820, compuesta
por 2505 mujeres y 2315 hombres, de modo que
la proporción por sexo se manene respecto a la
población. Este tamaño resultó de considerar una
probabilidad de ingreso conservadora (p=0.5),
margen de error del 1% y nivel de conanza del
95%. Asimismo, puesto que se conoce el tamaño
de la población, se aplica el ajuste para poblaciones
nitas (22).
Para cada uno de los registros en la muestra, se
examinó en retrospecva si había postulado e
ingresado en alguno de los ciclos considerados
(2017-1 al 2021-1, excepto 2020-2 pues no se llevó
a cabo examen de admisión debido a la pandemia
por COVID-19). Una muestra de cinco datos se
presenta en la tabla 1, a parr de la cual se puede
apreciar que los registros 1 y 4 presentan censura
aleatoria, ya que los postulantes no ingresaron
y desiseron luego del primer y tercer intento,
respecvamente. Sucede lo contrario con los
registros 2, 3 y 5, puesto que han postulado hasta
lograr el ingreso a la universidad. Finalmente, las
celdas en blanco implican que el postulante no se
inscribió en el examen de admisión para ese ciclo.
Se considera que las variables aleatorias X
1
,…,X
n
son
los empos discretos de falla o de supervivencia,
que en este caso viene a ser el número de veces que
la persona postula antes de ingresar. Estas variables
aleatorias son independientes e idéncamente
distribuidas (i.i.d.) según una Geométrica (θ),
siendo θ la probabilidad de que suceda el evento
de interés (que el postulante ingrese a la UNALM).
Además, los postulantes pueden ser censurados
en los momentos T
1
,...,T
n
, es decir se registra el
número de veces que la persona postula sin lograr