Inicio ForoGauss Matemáticas Dudas/Consultas COEFICIENTE DE VARIACIÓN DE PARES DE DATOS

  • Este debate tiene 2 respuestas, 1 mensaje y ha sido actualizado por última vez el hace 1 año por .
Viendo 3 publicaciones - del 1 al 3 (de un total de 3)
  • Autor
    Mensajes
  • #14213 Responder
    Borja
    Invitado

    Hola, me gustaría saber si me podéis echar un cable con un problemilla estadístico que tengo.

    Mi pregunta es: ¿Cuál es la forma más correcta de calcular el coeficiente de variacion de un grupo de pares de datos?

    Supongamos que medimos el peso (por duplicado) en Kg de 5 personas con una misma báscula y obtenemos:

    PERSONA MEDICION 1 MEDICION 2
    1 56 58
    2 80 79
    3 64 66
    4 72 68
    5 50 51

    ¿Cuál sería el coeficiente de variación (CV) de la báscula?

    ¿Alguna de estas 2 opciones sería correcta? ¿Cuál y por qué?

    Opción 1: Calcular el coeficiente de variación de cada par de datos cómo la desviación estándar del par entre el promedio del par en porcentaje. Después promediar los 5 CV que se obtienen. Es decir:

    PERSONA SD PROMEDIO CV%
    1 1.414 57.0 2.5
    2 0.707 79.5 0.9
    3 1.414 65.0 2.2
    4 2.828 70.0 4.0
    5 0.707 50.5 1.4

    CV global (%) = (2.5+0.9+2.2+4.0+1.4)/5 = 2.2%

    Opción 2: Calcular las varianzas de cada par de datos. Promediar las 5 varianzas para obtener la varianza global. Hacer la raiz de la varianza global para obtener el SD global. Dividir el SD global entre el promedio de los 10 datos y multiplicar por 100. Es decir:

    PERSONA VAR
    1 2.000
    2 0.500
    3 2.000
    4 8.000
    5 0.500

    VAR global = (2.000+0.500+2.000+8.000+0.500)/5 = 2.600
    SD global = Raiz(2.600) = 1.612
    Peso promedio = (56+58+80+79+64+66+72+68+50+51)/10 = 64.4

    CV global (%) = 1.612/64.4 * 100 = 2.5%

    Gracias de antemano

    Un saludo

    #14218 Responder
    Konhat
    Invitado

    Buenas noches, Borja.

    Así es como yo lo entiendo:
    No me meteré mcuho en tecnicismos porque, si estás dando el CV, seguramente no sabrás mucho vocabulario estadístico; pero emepcemos por el principio: el coeficiente de variación de un conjunto de datos con media x y desviación típica s es CV=s/x. Por tanto, lo que queremos hallar es la variación de los valores que arroja la báscula (peso) respecto al dato «real», siendo en este caso el peso.

    Para empezar, si pesas a una persona una cantidad suficientemente grande de veces verás que el peso tiende a rondar una serie de valores. Ésto ocurre porque la báscula no nos puede dar el peso exacto, porque está fluctuando, pero podemos asegurar que el peso estará entre las mediciones que hemos hecho; en este caso, dos. Por ello creo que el método 2 es más preciso.

    El método 1 es más una aproximación de otra aproximación…no sé si has oído algo de teoría del error, pero básicamente lo que haces en el 1 es redondear sucesivamente los valores (porque al calcular cada variación has tenido que redondear por el tema de las raíces, y al calcular la media habrás tenido que aproximar otra vez…) y ganas margen de error en cada operación por ir aproximando. (Si has entendido puedes saltar al siguiente párrafo) Dicho de otro modo: imagina que puedes afirmar que la CV es de 2.3458496584958% exactamente. Al calcular una raíz cuadrada, te habrás quedado con…digamos 6 decimales, ahora tienes 2.345849%. Y ahora el promedio, te quedarías con dos o tres: ~2.344%. Con pocos datos como tienes en el enunciado no se nota (generalmente estos estudios se hacen con 30 ó 40 de mediciones como mínimo), pero si hubieras hecho más mediciones verías que el porcentaje se sensibiliza por ir redondeando.

    Por ello (perdona si he sonado muy críptica, explicar por texto no es mi fuerte) considero más adecuado el método 2, que requiere de menos operaciones.

    #14219 Responder
    Borja
    Invitado

    Hola, muchas gracias por la respuesta. El ejemplo de la báscula era sólo un caso sencillo para poder entendernos, en realidad dispongo de una cantidad mucho mayor de datos

    Entiendo lo que comentas de la acumulación de errores, pero no quería centrarme en eso, sino en el propio proceso de cálculo. Suponiendo que fuese posible realizar los cálculos de forma exacta sin perder decimales por redondeo (o al menos despreciando este efecto), ¿qué método sería más correcto?

    He observado que el método 2 da más peso a las diferencias grandes entre pares de valores. Cuando las variaciones entre pares de datos son pequeñas los resultados obtenidos por ambos métodos son muy similares, sin mebargo, cuando aparece algún par de valores con una diferencia grande los CV de ambos métodos son sensiblemente diferentes.

    Un saludo

Viendo 3 publicaciones - del 1 al 3 (de un total de 3)
Respuesta a: COEFICIENTE DE VARIACIÓN DE PARES DE DATOS
Tu información: