<< Chapter < Page Chapter >> Page >

Perfil plano de gprof

Como mencionamos previamente, gprof también produce un perfil de cronometraje (también conocido como un perfil "plano", un término algo confuso) similar al que produce prof . Unos pocos campos son diferentes de prof , y también hay algo de información extra, así que será de ayuda explicarlo brevemente. El siguiente ejemplo muestra unas pocas de las primeras líneas de un perfil plano de gprof para el programa stuff . Reconocerá del programa original las tres rutinas superiores. Las otras son funciones de biblioteca incluidas a tiempo de enlace.


% cumulative self self total time seconds seconds calls ms/call ms/call name39.9 3.23 3.23 2 1615.07 1615.07 _c_ [6] 39.9 6.46 3.23 1 3230.14 4845.20 _b_ [4]20.0 8.08 1.62 1 1620.07 3235.14 _a_ [5] 0.1 8.09 0.01 3 3.33 3.33 _ioctl [9]0.0 8.09 0.00 64 0.00 0.00 .rem [12] 0.0 8.09 0.00 64 0.00 0.00 _f_clos [177]0.0 8.09 0.00 20 0.00 0.00 _sigblock [178] ... .... .... . . . ......

He aquí el significado de cada columna:

  • %time Nuevamente, vemos un campo que describe el tiempo de ejecución de cada rutina, como un porcentaje del tiempo global del programa. Como puede usted esperar, todas las entradas esta columna deben totalizar (aproximadamente) un 100%.
  • cumulative seconds. Para una rutina dada, la columna llamada "segundos acumulados" hace un recuento de la suma del tiempo de ejecución ejecución tomado por todas las rutinas precedentes, más el tiempo propio. Conforme la vaya revisando hacia abajo, verá que los números se aproximan asintóticamente al tiempo total del programa.
  • self seconds La contribución individual de cada rutina al tiempo total de ejecución.
  • calls El número de veces que fue invocada esta rutina en particular.
  • self ms/call Los segundos gastados adentro de la rutina, dividido entre el número de llamadas. Ello nos da una duración promedio del tiempo tomado por cada invocación a la rutina. La cantidad está medida en milisegundos.
  • total ms/call Los segundos gastados adentro de la rutina más sus descendientes, dividido entre el número de llamados.
  • name El nombre de la rutina. Observe que de nuevo aparece aquí el número de referencia cruzada.

Acumulando los resultados de varias corridas de gprof

Es posible acumular estadísticas provenientes de múltiples corridas, de forma que obtenga usted una instantánea del comportamiento del programa con una variedad de conjuntos de datos. Por ejemplo, digamos que quiere usted perfilar una aplicación - llamémosla bar — con tres conjuntos de datos distintos. Puede realizar las corridas separadamente, guardando los archivos gmon.out conforme las ejecuta, y luego combinar los resultados en un solo perfil al terminar:


% f77 -pg bar.f -o bar % bar<data1.input % mv gmon.out gmon.1% bar<data2.input % mv gmon.out gmon.2% bar<data3.input % gprof bar -s gmon.1 gmon.2 gmon.out>gprof.summary.out

En el perfil de ejemplo, cada corrida crea un nuevo archivo gmon.out que luego renombramos para que no sea encimado por el siguiente. Al final, gprof combina la información de cada uno de los archivos de datos para producir un perfil sumario de bar en el archivo gprof.summary.out . Adicionalmente (aunque no se muestra aquí), gprof crea un archivo llamado gmon.sum que contiene los datos mezclados a partir de los tres archivos de datos originales. gmon.sum tiene el mismo formato que gmon.out , de forma que pueda usted usarlo como entrada para producir otros perfiles mezclados si así lo requiere.

Al menos en forma, la salida del perfil mezclado luce exactamente igual que el de una corrida individual. Pero hay un par de cosas interesantes que debemos señalar. Por un lado, la rutina main parece haber sido invocada más de una vez - de hecho, una vez por cada corrida. Además, dependiendo de la aplicación, las múltiples ejecuciones tienden o bien a suavizar el contorno del perfil, o bien a exagerar sus características. Puede imaginar cómo es que esto sucede. Si se está invocando constantemente una única rutina, mientras que las otras vienen y van conforme cambian los datos de entrada, ésta toma una importancia creciente en sus esfuerzos de afinación.

Unas pocas palabras acerca de la exactitud

En aquellos procesadores que se ejecutan a 600 MHz o más, el tiempo que transcurre entre muestras de 60 Hz y 100 Hz es una verdadera eternidad. Es más, puede que experimente usted errores de cuantificación cuando la frecuencia de muestreo es fija, como es el caso en muestras de 1/100 y 1/60 de segundo. Para usar un ejemplo exagerado, asumamos que la línea de tiempo en [link] muestra invocaciones alternadas a dos subrutinas, BAR y FOO . Las marcas cronométricas representan los puntos de muestreo del perfilado.

Errores de cuantificación al perfilar

Esta figura es una línea compuesta por secciones alternadas de color gris claro y gris oscuro. Las secciones claras son más anchas, y están etiquetadas como bar, y las más obscuras están etiquetadas como foo.

BAR y FOO se ejecutan por turnos. Pero BAR toma más tiempo que FOO . Y dado que el intervalo de muestreo es muy cercano a la frecuencia en que ambas se alternan, tenemos un error de cuantificación: la mayoría de las muestras se están tomando mientras FOO se está ejecutando. Así, el perfil nos dice que FOO usa más tiempo de CPU que BAR .

Hemos descrito y probado los perfiladores de subrutinas reales que han estado disponibles en UNIX durante años. En muchos casos, los vendedores tienen herramientas mucho mejores, ya sea a la venta o gratis. Si usted está haciendo un trabajo de afinación serio, pregunte a su representante de ventas qué otras herramientas le ofrece.

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Cómputo de alto rendimiento. OpenStax CNX. Sep 02, 2011 Download for free at http://cnx.org/content/col11356/1.2
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Cómputo de alto rendimiento' conversation and receive update notifications?

Ask