确定分布式应用程序中的问题

标准化数据收集是由 Hyades 项目标识的一项核心技术需求。作为上述技术的第一个开拓者,面向开发者和支持人员的“日志和跟踪分析器”就是在当前 Eclipse 工具的基础上开发的。

已经设计出这样的接口,它提供单点操作来处理由已部署系统的各种组件产生的日志和跟踪。链接这两组工具(跟踪和记录)有助于将应用程序及中间件的问题确定与调试连在一起。通过捕获客户应用程序的分布式堆栈中的端到端事件并使它们相互相关,此工具允许以更加结构化的方式分析分布式应用程序问题。此工具使人们能够更容易和更快地调试和解决系统中的问题。

在由一组产品组成的系统中,确定问题根本原因可能很困难。所有产品都会生成问题确定数据,例如跟踪记录、日志记录和消息。但是,将不同产品和不同服务器上的产品间的问题确定数据相关却并不容易。每个产品的问题确定数据在整体系统问题中只是以一个小窗口中的一个视图的形式出现。用时间戳记是不够的:它们的粒度不够,并且通常各个服务器的时钟不能充分同步。所有这些问题会使问题隔离工作(即,确定哪个服务器、哪个产品出现问题以及问题的根本原因是什么)变得很困难,而这种复杂性随系统的复杂性和大小的增加而增加。

“日志和跟踪分析器”(它使您能够导入各种日志文件以及症状数据库,可以对照这些数据库来分析日志文件并使它们相关)可降低这种复杂性。现在的解决方案中的问题隔离的核心问题是产品之间的问题确定数据不相关,即,不能很容易地确定一个产品捕获的事件与另一个产品捕获的事件的关系。“日志和跟踪分析器”通过以下方法来解决此问题:允许您从多个产品导入和分析日志文件(或跟踪文件)以及确定这些产品捕获的事件之间的关系(相互关系)。

已在 Eclipse Test and Performance Tools Platform 项目上公开了所有“日志和跟踪分析器”基础结构。 

以下是“日志和跟踪分析器”提供的功能的摘要。

导入日志文件
导入日志文件

日志分析器视图
“日志”视图
“日志交互”视图(相互关系)
“日志线程交互”视图(相互关系)

日志解析器和相关引擎插件信息
创建日志解析器和相关因子的指南

症状数据库和分析引擎
症状数据库
症状数据库编辑器
导入和使用症状数据库
编辑症状数据库
创建症状数据库
导出症状数据库

分析日志文件
分析日志文件
记录实用程序支持
设置记录首选项

相关概念
症状数据库
公共基本事件模型
日志文件相互关系
“日志”视图
概要分析工具概述

相关任务
设置记录首选项
使用日志文件
导入和使用症状数据库
创建日志解析器和相关因子的指南
创建分析引擎的指南

(C) Copyright IBM Corporation 2000, 2005. All Rights Reserved.