|
5 Fachbereich Statistik 5.2 Lehrstuhl Mathematische Statistik und biometrische Anwendungen. 5.3 Lehrstuhl Mathematische Statistik und naturwissenschaftliche Anwendungen 5.4 Institut für Wirtschafts- und Sozialstatistik 5.5 Lehrstuhl Statistik mit Anwendungen im Bereich der Ingenieurwissenschaften 5.6 Lehrstuhl Statistik und Ökonometrie 5.7 Lehrstuhl Mathematische Statistik und industrielle Anwendungen. 5.8 Lehrstuhl Computergestützte Statistik 5.9 Fachgebiet Statistik in den Biowissenschaften 5.10 Fachgebiet Statistische Methoden in der Genetik und Ökologie 5.11 Sonderforschungsbereich 475 - Komplexitätsreduktion in multivariaten Datenstrukturen
5.1 DekanatKontakt Dekanat Statistik Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3109, Telefax: 0231/755-3918 dekanat@statistik.uni-dortmund.de Forschung Die Statistik beschäftigt sich mit der Beschreibung und Analyse von Zusammenhängen, welche am Einzelfall nicht ersichtlich, sondern nur durch die Beobachtung eines größeren Teils einer ganzen Population erkannt werden können. Sie verwendet dazu spezielle Modelle und Verfahren, die auf mathematischer Grundlage abgeleitet werden, sowie umfangreiche Programmsysteme, welche zu diesem Zweck entwickelt und laufend erweitert werden. Es ist heutzutage kaum mehr möglich, einen Gesamtüberblick über alle Anwendungsgebiete der Statistik zu bekommen. Deshalb hat der Fachbereich drei Bereiche abgegrenzt, die noch einigermaßen überschaubar sind und die im Mittelpunkt seiner Forschung stehen. Diese drei Schwerpunkte sind:
· Biometrie · Ökonometrie/Empirische Wirtschaftsforschung · Technometrie
In der Zwischenzeit ist der Computer in der statistischen Wissenschaft nicht mehr nur das wichtigste Hilfsmittel zur Umsetzung mathematisch begründeter und untersuchter Verfahren, sondern durch ihn wurde das statistische Methodenspektrum wesentlich verbessert und erweitert. Mittels des Computers ist es gelungen, neue statistische Verfahren der Datenanalyse zu entwickeln, die sonst gar nicht erdacht worden wären. Der Computer ermöglicht z.B. einen Grad der Visualisierung der Strukturen eines hochdimensionalen Datensatzes, der ohne dieses Werkzeug nicht denkbar wäre. Deshalb stellt heute die computergestützte statistische Forschung neben der statistischen Theorie eine zweite Säule der statistischen Methodik dar. In den vergangenen 10 Jahren haben sich am Fachbereich Statistik folgende Forschungsschwerpunkte herausgebildet:
Allgemeine statistische Methoden:
Optimale Versuchsplanung, Erhebungsverfahren, Stichprobenverfahren, Robuste Verfahren, Ausreißerbehandlung, Extremwertstatistik, Regressionsanalyse, Varianzkomponentenmodelle, lineares Modell, nichtparametrische Methoden, multivariate Statistik, Dimensionsreduktion, Projektoren, Zeitreihenanalyse.
Statistische Methoden im Bereich Medizin, Biologie und Ökologie:
Epidemiologische Methoden, Landwirtschaftliches Versuchswesen, Analyse von Ringversuchen, statistische Methoden in der Genetik, räumliche Statistik, Analyse von Online-Monitoring-Daten aus der Intensivmedizin, Meta-Analyse.
Statistische Methoden im Bereich Ökonometrie und Wirtschaftsstatistik: Konzentrationsmessung, Empirische Kapitalmarktforschung, Gesundheitsökonomie, multivariate Konjunkturanalyse, Verwertung von a priori-Informationen, Wirtschaftsprognosen.
Statistische Methoden im Bereich Ingenieurwissenschaften:
Zuverlässigkeitstheorie, Qualitätssicherung, faktorielle Versuchsplanung, Taguchi-Methoden, Analyse multipler Ziele, Kontrollkarten, Prozessfähigkeitsanalyse.
Statistische Methoden im Bereich Computergestützte Statistik:
Statistische Graphik, Datenvisualisierung, Computersimulation, Sampling-Verfahren, Wissensentdeckung in Datenbanken, statistische Software, Optimierungsverfahren.
Seit 1993 werden die Doktoranden des Fachbereiches durch ein Graduiertenkolleg "Angewandte Statistik" der DFG unterstützt. Am Fachbereich besteht seit 1997 der Sonderforschungsbereich 475 "Komplexitätsreduktion in multivariaten Datenstrukturen", in dem auch externe Wissenschaftler mitarbeiten. Ausgehend von verschiedenen Sachfragen in Anwendungsgebieten der Biometrie, der empirischen Wirtschaftsforschung und der Technometrie steht die Komplexitätsreduktion in multivariaten Datenstrukturen als gemeinsame methodische Grundlage im Zentrum der Forschungsvorhaben des SFB. Einige Hochschullehrer/innen arbeiten vorwiegend an den theoretischen Grundlagen dieses Gebietes (Robustheitsüberlegungen, Kovarianzstruktur-Analysen, Dimensionsreduktion, Prognosemodelle und maschinelle Lernverfahren), andere an ökonomischen Anwendungen (Kapitalmarktpreise, Konjunkturzyklen, Wirtschaftsprognosen etc.) bzw. im biometrischen und technometrischen Bereich (räumliche Verteilungen, Meta-Analyse, Online-Monitoring, Versuchsplanung). 5.2 Lehrstuhl Mathematische Statistik und biometrische AnwendungenLeitung Prof. Dr. Schach, Siegfried (Lehrstuhlinhaber); Groß, Jürgen (Vertretung) Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3120, Telefax: 0231/755-5303 schach@.statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/biometrie.html Aufgabe Lehre und Forschung im Bereich statistischer Methoden in Biometrie und Epidemiologie 5.3 Lehrstuhl Mathematische Statistik und naturwissenschaftliche AnwendungenLeitung Prof. Dr. Kunert, Joachim Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3113, Telefax: 0231/755-3454 kunert@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/naturwissenschaft.html Aufgabe Lehre und Forschung Diplom-Staatsarbeiten 7 Dissertationen 2
5.3.1 Studien zur Eignung der Varianzanalyse für die Analyse sensorischer DatenLeitung Prof. Dr. Kunert, Joachim Mitarbeit Dipl. Stat. Meyners, Michael; Dipl. Stat. Erdbrügge, Martina Förderung DANONE VITAPOLE, Paris; Wirtschaft, private Einrichtungen; GIE LVMH RECHERCHE, Orleans; PSA PEUGEOT CITROEN, Paris Laufzeit 01.12.2000 - 30.07.2001 Publikationen Kunert, J., Meyners, M. and Erdbrügge, M.: On the applicability of ANOVA for the analysis of sensory data. Accepted for presentation at Journées Européennes Agro-Industries et Méthodes Statistiques, Lille 2002. 5.3.2 Planung und Auswertung von Versuchen zur Identifikation von Einflußfaktoren für die Pneumatische Flotation mit Pneuflot-ZellenLeitung Prof. Dr. Kunert, Joachim Mitarbeit Dr. Lehmkuhl, Frank Beschreibung Im Versuch sollte für vier Faktoren untersucht werden, welche Wirkung eine gezielte Veränderung dieser Faktoren auf das Verhalten der Pneumatischen Flotation hatte. Der Versuch wurde als fraktionierter faktorieller Versuchsplan durchgeführt, der gesamte Versuch wurde einmal wiederholt. Zusätzlich wurden vier Läufe im Nullpunkt durchgeführt, bei denen jeder Faktor auf seiner mittleren Einstellung stand. Die Auswertung ergab eine signifikante Wirkungen auf die Zielvariablen für einige Faktoren. Förderung Ruhrkohle Bergbau AG, Herne 5.3.3 Anwendung von statistischen Methoden in der LebensmittelsensorikLeitung Prof. Dr. Kunert, Joachim Beschreibung Förderung eines Auslandsaufenthaltes während eines Forschungsfreisemesters. Förderung VW-Stiftung Laufzeit 01.03.1998 - 31.08.1998 Publikationen Kunert, J. (2000): Workshop on the Statistical Analysis of Sensory Profiling Data: Randomization / Permutation / ANOVA. Food Quality and Preference 11, 141 - 143. Kunert, J. und Martin, R.J. (2000): On the
determination of optimal designs for an interference model, Annals of
Statistics 28, 1728 - 1742. 5.3.4 Forschergruppe Flexibler Normalismus - Teilprojekt Z1Leitung Prof. Dr. Kunert, Joachim; Priv.-Doz. Dr. Pöhlmann, Sigrid Mitarbeit Dipl. Stat. Montag, Astrid Beschreibung Zentrales Anliegen der Forschergruppe ist die Untersuchung der "flexiblen Normalität" als statistisch gewonnener Norm für die Selbsteinschätzung von Einzelnen und von Gruppen. Dabei ist zu untersuchen, inwieweit die Statistik tatsächlich an Einfluss gewonnen hat, inwieweit beispielsweise die Informationen, die man aus Zeitschriften erhält, in zunehmendem Maße in statistischer Form gegeben werden. Es ist auch zu untersuchen, inwieweit die Selbsteinschätzung der Individuen tatsächlich zunehmend weniger durch absolut gesetzte Regeln, sondern zunehmend mehr durch die Überlegung, welches Verhalten noch als "normal" im statistischen Sinne anzusehen ist, geprägt wird. Dazu planen die Einzelprojekte teilweise eigene empirische quantitative Untersuchungen und teilweise den Abgleich von Teilaspekten eigener qualitativer Untersuchungen mit den Daten quantitativer Statistiken. Diese Arbeit sollte mit modernen statistischen Verfahren durchgeführt werden. Dabei sind insbesondere multivariate Analysemethoden der Schließenden Statistik, wie etwa multivariate Signifikanztests sowie Methoden der Datenanalyse hochdimensionaler Datensätze zu nennen. Es erscheint der Forschergruppe sinnvoll, dabei nicht nur auf allgemein bekannte statistische Verfahren zurückzugreifen, sondern durch die intensive Mitarbeit von Fachstatistikern geeignete Methoden der Datenanalyse und der schließenden Statistik problembezogen weiter zu entwickeln. Die Fachstatistiker verstehen sich dabei als Helfer der Teilprojekte: Sie sollten von den Teilprojekten konkrete Fragestellungen und Daten erhalten und ihre Methoden zur Bearbeitung dieser Fragestellung verwenden, indem sie die Daten analysieren, die ihnen zur Verfügung gestellt werden. Sie beraten die Teilprojekte auch durch statistische Versuchsplanung bei der Erhebung der Daten. Förderung DFG allgemein Laufzeit 01.09.1998 - 30.08.2000 Publikationen Kunert, J., Montag, A. und Pöhlmann, S. (2001): The Quincunx: History and Mathematics. Statistical Papers 42, 143 - 169. Kunert, J., Montag, A. und Pöhlmann, S. (2001): Das Galtonbrett und die Glockenkurve. In: Infografiken, Medien, Normalisierung: Zur Kartografie politisch-sozialer Landschaften. U. Gerhard, J. Link, E. Schulte-Holtey (eds.), Synchron, Heidelberg, 25 -53. 5.4 Institut für Wirtschafts- und SozialstatistikLeitung Prof. Dr. Krämer, Walter Kontakt Vogelpothsweg 78 (CDI-Gebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3125, Telefax: 0231/755-5284 walterk@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/wirtschaftundsozial.html Aufgabe Forschung und Lehre auf den Gebieten Empirische Kapitalmarktforschung, Zeitreihenverfahren, Lineare Regressionsmodelle, Konzentrationsmessung, Gesundheitsökonomie. Diplom-Staatsarbeiten 11 Dissertationen 1 5.4.1 Statistische Problematik der ArmutsmessungLeitung Prof. Krämer, Walter Mitarbeit Dr. Berghoff, Sonja; Dr. Kleiber, Christian; Dr. Ziebach, Thorsten Beschreibung Im ersten Teil soll zunächst die Genesis der aktuell üblichen Definitionen von Armut geklärt werden. Es soll herausgearbeitet werden, welche Personen, Institutionen oder politischen Gruppierungen in der Bundesrepublik die Armutsdiskussion bestimmen bzw. "Armut" konstatieren. Bezüglich der Diskussion von Messfehlern ist sowohl auf Fehler bei der Einkommensbestimmung als auch bei der Festlegung von Armutsgrenzen einzugehen. Im zweiten Teil sollen die allgemeinen Konzepte und Einsichten aus Teil 1 auf die konkrete Armutsmessung in der Bundesrepublik angewendet werden. Dazu sind vor allem existierende Daten aus dem Mikrozensus, aus dem Sozio-Ökonomischen Panel, aus der Einkommens- und Verbrauchsstichprobe, aus Steuer- und Sozialhilfestatistiken, aus den Unterlagen der Wohlfahrtsverbände und anderen allgemein zugänglichen öffentlichen und privaten Datensammlungen auszuwerten. Diese Daten sind auf Vollständigkeit, Kompatibilität, internationale Vergleichbarkeit und Messfehler zu prüfen. Am Ende sollen die Fragen beantwortet werden, wie groß die Armut hierzulande ist, inwieweit das Ausmaß der Armut von den Dateninputs und von der Armutsformel abhängt und wie die Bundesrepublik bei internationalen Vergleichen rangiert. Folgenden Punkten soll dabei besondere Aufmerksamkeit gewidmet werden: (I) Die Gegenüberstellung von Einkommen und Vermögen. Inwieweit ist es sinnvoll, Armut allein am Einkommen zu bemessen? Wie kam diese Fixierung auf das Einkommen historisch zustande? (II) Welche Komponenten des Einkommens werden bei dessen Messung typischerweise übersehen? Ist das Familieneinkommen oder das Individualeinkommen relevant? Hier sind die in der Antwort I.3 auf die Große Anfrage der SPD (BT-Drs. 13/3339) vorgebrachten Argumente aufzugreifen und zu erweitern.
(III) Verlässlichkeit und Glaubwürdigkeit der einschlägigen Statistiken (IV) Einkommen versus Konsum: hier sind die neueren Ansätze der EG zu diskutieren, welche die Armut eines Haushalts weniger an dessen Einkommen als an dessen Konsumverhalten messen. Förderung Bund Laufzeit 01.11.1996 - 31.03.1998 Publikationen Krämer, W.: Statistische Probleme der Armutsmessung, Schriftenreihe des Bundesministerium für Gesundheit, Nomos-Verlag, Baden-Baden, 1997. 5.4.2 Erklärung und Modellierung von FinanzmarktvolatilitätenLeitung Prof. Krämer, Walter Mitarbeit Dr. Sibbertsen, Philipp Beschreibung Das Projekt widmete sich schwerpunktmäßig der statistischen Überprüfung der Informationseffizienz des deutschen Aktienmarktes. Es wurde empirisch überprüft, ob Kointegrationsbeziehungen zwischen Aktienkursen bestehen (in informationseffizienten Märkten sind diese ausgeschlossen), wie sich statistische Tests bei nicht den üblichen Regeln folgenden Kointegrationsbeziehungen verhalten und wie schwere Ränder, die für Kapitalmarktrenditen typisch sind, die Nullverteilung und die Macht von Effizienzmarkttests beeinflussen. Der zweite Projektteil war vor allem dem Phänomen des langen Gedächtnisses in den Volatilitäten deutscher Aktienrenditen gewidmet. So wurde in den Volatilitäten zahlreicher Renditen deutscher Unternehmen, wie zum Beispiel BMW, Daimler, Hoechst, BASF eine starke Abhängigkeitsstruktur gefunden. Ziel dieses Projektes war es zu untersuchen, ob diese Abhängigkeitsstruktur ein Artefakt möglicher Trends oder Strukturbrüche ist. Da für diese Fragestellung jede statistische Methodik bisher fehlt, wurde die Entwicklung dieser Thematik in zwei Richtungen betrieben. Zum einen wurden klassische Tests auf Strukturbruch auf ihr Verhalten bei langem Gedächtnis untersucht (siehe Krämer/Sibbertsen (2000) und Sibbertsen (2000)). Zum anderen wurden aber auch nichtparametrische Schätzer für allgemeine Trends auf ihr Verhalten hin untersucht (siehe Beran/Feng/Gosh/Sibbertsen (2000) und Beran/Gosh/Sibbertsen (2000)). Hierbei wurden auch die Probleme berücksichtigt, die ein Börsencrash auf die Schätzung haben kann, indem direkt allgemeinere robuste Modelle betrachtet wurden. Dies geschah in einer Kooperation mit Prof. Dr. Jan Beran vom Center for Finance and Econometrics an der Universität Konstanz. Die für diese Ergebnisse nötigen Vorarbeiten wurden in Sibbertsen (1998, 1999) geleistet. Förderung DFG allgemein Laufzeit 01.01.1999 - 31.03.2001 Kooperation Prof. Dr. Jan Beran, Center for Finance and Econometrics, Universität Konstanz Publikationen Sibbertsen, P.: Robuste Parameterschätzung im linearen Regressionsmodell bei Fehlertermen mit langem Gedächtnis, Verlag für Wissenschaft und Forschung, Berlin (Dissertation). Beran J., Feng Y., Ghosh S., Sibbertsen P.: On robust local polynomial estimation with long-memory errors,Technical Report 35/2000, SFB 475, Universität Dortmund. Beran J., Ghosh
S., Sibbertsen P.: Nonparametric M-estimation with long-memory errors,
Technical Report 36/2000, SFB 475, Universität Dortmund. Krämer W.,
Sibbertsen P.: Testing for structural change in the presence of long-memory,
Technical Report 21/2000, SFB 475, Universität Dortmund. 5.5 Lehrstuhl Statistik mit Anwendungen im Bereich der IngenieurwissenschaftenLeitung Prof. Dr. Hartung, Joachim Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3295, Telefax: 0231/755-5304 hartung@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/ingenieur.html Aufgabe Lehr- und Forschungstätigkeit, Beratung, Datenanalyse, Erstellung von technischen und biometrischen Gutachten Diplom-Staatsarbeiten 3 Dissertationen 4 5.6 Lehrstuhl Statistik und ÖkonometrieLeitung Prof. Dr. Trenkler, Götz Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3174, Telefax: 0231/755-5907 trenkler@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/oekonometrie.html Aufgabe Der Lehrstuhl arbeitet auf den Gebieten der Nichtparametrik, des linearen Regressionsmodells und der Matrixalgebra, hier insbesondere auf dem Gebiet der Projektoren. Außerdem werden auch Bereiche untersucht, die Sport und Statistik zusammenführen. Am Lehrstuhl lief im Zeitraum 1995/96 ein Forschungsprojekt über Kovarianzstrukturen und laufen derzeit Projekte über Projektoren und über Strategien zur Kombination von Wirtschaftsprognosen. Desweiteren bietet der Lehrstuhl verschiedene Anfänger- und Fortgeschrittenen-Vorlesungen, sowie Seminare an. Diplomarbeiten, Dissertationen und Habilitationsvorhaben werden ebenfalls betreut. Diplom-Staatsarbeiten 16 Dissertationen 2 5.6.1 Untersuchung und Darstellung von Schätzverfahren in linearen Modellen unter Berücksichtigung ihrer ZulässigkeitLeitung Prof. Dr. Trenkler, Götz Mitarbeit PD Dr. Groß, Jürgen Beschreibung Das Ziel des Projekts liegt in der Abfassung einer einheitlichen Darstellung und umfassenden Übersicht zu verschiedenen Schätzmethoden in linearen Modellen. In Ergänzung zu bisher vorhandenen Lehr- und Textbüchern wird in der fertigzustellenden Monographie die Frage nach der Zulässigkeit dieser Methoden intensiv behandelt. Dabei werden verschiedene, in der wissenschaftlichen Literatur diskutierte Aspekte, wie etwa lineare und ellipsoidale Nebenbedingungen, aufgegriffen und möglichst verständlich und anwendungsbezogen abgehandelt. Soweit angebracht, werden kurze simulierte Beispiele eingefügt, die das Verhalten der jeweiligen Schätzer demonstrieren. Die Monographie soll darlegen, dass das aus der Entscheidungstheorie stammende Kriterium der Zulässigkeit ein wichtiges Hilfsmittel ist, wenn es um die Bewertung von Schätzmethoden in linearen Modellen geht. Langfristig soll damit auch dem Einzug dieses Instrumentariums sowohl in die Praxis, als auch in die Lehre der Theorie der linearen Modelle verholfen werden. Förderung DFG; TR 253/3-1, TR 253/3-2; DFG allgemein Laufzeit 01.01.1999 - 31.12.2002 Publikationen Groß, J. (2001): Lineare Regression - Punktschätzverfahren und ihre Zulässigkeit, Monographie, zur Veröffentlichung eingereicht beim Springer-Verlag. Groß, J. und Markiewicz, A. (1999): On admissibility of linear estimators with respect to the mean square error matrix criterion under the general mixed linear model, Statistics, 33, 57-71. Groß, J. (1999): Local improvement of best linear unbiased estimation and admissibility under the weakly singular Gauss-Markov model, Communications in Statistics, Theory and Methods, 28, 1803-1812. Groß, J. und Puntanen, S. (2000). Estimation under a general partitioned linear model. Linear Algebra and Its Applications, Vol. 321, No. 1-3, 131-144. Groß, J. (2001). Löwner partial ordering and space preordering of Hermitian nonnegative definite matrices. Linear Algebra and Its Applications, Vol. 326, 215-223. Groß, J. (2000). Nonnegative and positive definite solutions to the matrix equation AXA*=B -- Revisited. Linear Algebra and Its Applications. Vol. 321, No. 1-3, 123-129. Groß, J. und Trenkler, G. (2000). Complementing remarks on a matrix extension of the Cauchy-Schwarz inequality. Journal of Statistical Computation and Simulation, zur Veröffentlichung angenommen. 5.6.2 Projektoren in der StatistikLeitung Prof. Dr. Trenkler, Götz Mitarbeit Dr. Groß, Jürgen Beschreibung Ziel des Projektes war es, praktische Probleme in der Statistik und Ökonometrie mit Hilfe des Projektorenkalküls anzugehen. Im Vordergrund standen dabei Fragen aus dem Bereich der Regressionsanalyse, wie zum Beispiel Zulässigkeit oder lineare Suffizienz. Dabei gelang eine einheitliche Darstellung dieser Probleme durch das Projektorenkalkül, und es zeigte sich, dass sich einige der bereits bekannten Resultate vereinfachen ließen. Außerdem wurden neue Charakterisierungen von schiefen, orthogonalen und verallgemeinerten Projektoren hergeleitet. Förderung DFG; TR 253/2-1, TR 253/2-2, TR 253/2-3; DFG allgemein Laufzeit 01.01.1995 - 31.12.1998 Publikationen Groß, J., Trenkler, G und Werner, H.J. (2000). The equality between linear transforms of ordinary least squares and best linear unbiased estimator. Sankhya, Series A, Vol. 63, 118-127. Groß, J. und Trenkler, G. (1998). On the product of oblique projectors. Linear and Multilinear Algebra, Vol. 44, No. 3, 247-260. Groß, J. (1999). On the product of orthogonal projectors. Linear Algebra and Its Applications, Vol. 289, No. 1-3, 141-150. Groß, J. und Trenkler, G. (1998). On the equality of linear statistics in the general Gauss-Markov model. In: Frontiers in Probability and Statistics (Mukherjee, S.P., Basu, S.K., Sinha, B.K. (Ed.)), Narosa Publishing House, New Delhi, 189-194. Groß, J. (1998). On contractions in linear regression. Journal of Statistical Planning and Inference, Vol. 74, No. 2, 343-351. Trenkler, G. (1998). Two results on the efficiency of the Almon lag technique. Journal of Quantitative Economics, 14, 17-22. Groß, J. und Puntanen, S. (2000). A comment on pseudo-generalized least squares. Econometric Reviews, Vol. 19, No. 1, 131-133. Stemann, D. und Trenkler, G. (2000). Some further results on the efficiency of the Cochrane-Orcutt-Estimator. Journal of Statistical Planning and Inference, Vol. 88, 205-214.
Groß, J., Trenkler, G. und Troschke, S.-O. (1999). On semi-orthogonality and a special class of matrices. Linear Algebra and Its Applications, Vol. 289, No. 1-3, 169-182. Groß, J. (1998). Statistical estimation by a linear combination of two given statistics. Statistics & Probability Letters, Vol. 39, No. 4, 379-384. 5.7 Lehrstuhl Mathematische Statistik und industrielle AnwendungenLeitung Prof. Dr. Gather, Ursula Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231 / 755 - 3110, Telefax: 0231 / 755 - 5305 gather@statistik.uni-dortmund.de Aufgabe Die Aufgaben des Lehrstuhls für mathematische Statistik und industrielle Anwendungen liegen in den Bereichen der Lehre und Forschung. Im Rahmen der Lehre werden von der Lehrstuhlinhaberin sowie den wissenschaftlichen Mitarbeitern des Lehrstuhls regelmäßig Veranstaltungen zu Spezialgebieten der Statistik angeboten. Der Schwerpunkt liegt dabei auf solchen Themen, die mögliche Anwendungen im industriellen Bereich haben. Beispiele sind Vorlesungen zur Qualitätskontrolle, zu robusten statistischen Verfahren, generalisierten linearen Modellen oder zur Analyse von Überlebenszeiten. Ferner gehören Grundlagenvorlesungen des Grund- und Hauptstudiums zum Lehrangebot. Das Forschungsspektrum des Lehrstuhls ist vielfältig und umfasst u. A. robuste Verfahren, die Behandlung von Ausreißern, die Analyse hochdimensionaler Daten, dimensionsreduzierende Verfahren, Qualitätssicherung, generalisierte lineare und graphische Modelle, multiple Tests, Analyse von Überlebenszeiten, Zeitreihenanalyse, Analyse von Online-Monitoring-Daten, maschinelle Lernverfahren und Statistik sowie Data Mining. Diplom-Staatsarbeiten 12 Dissertationen 3 Habilitationen 1 5.7.1 Modellierung und Identifizierung von Ausreißern bei KontingenztafelnLeitung Prof. Dr. Gather, Ursula Mitarbeit Dipl.-Stat. Kuhnt, Sonja Beschreibung Als Ausreißer werden bei der statistischen Datenanalyse in der Regel solche Beobachtungen bezeichnet, die im Vergleich zu den Restlichen ungewöhnlich sind. Ziel des Projektes ist es, den Ausreißerbegriff für das Gebiet der Kontingenztafeln zu formalisieren und Verfahren zu ihrer Erkennung zu entwickeln. Der Ausreißerbegriff wird durch eine angemessene Übertragung der Idee der a-Ausreißer formalisiert. Für die Formulierung sinnvoller Methoden zur Entdeckung derartiger Ausreißern werden robuste Schätzer des unbekannten Erwartungswertvektors der betrachteten Loglinearen Poissonmodelle entwickelt. Dazu zählen neue Schätzer basierend auf der Minimierung der Hellinger-Distanz, auf dem Median-Polish-Schätzverfahren und dem L1-Schätzverfahren. Die Resistenz von Schätzern gegenüber einzelnen, im Vergleich zur Zielverteilung extremen, Beobachtungen kann anhand von Bruchpunkten beurteilt werden. Unter dem Aspekt der speziellen Situation der Kontingenztafelanalyse werden verschiedene mögliche Bruchpunktkonzepte diskutiert. Im Rahmen des Projektes werden für die Identifizierung von a-Ausreißern in Kontingenztafeln spezielle Outward-Prozeduren und einschrittige Identifizierungsverfahren formuliert und anhand von Simulationsstudien verglichen. Förderung DFG Laufzeit 01.08.1995-31.07.1998 Publikationen Kuhnt, S., Ausreißeridentifikation im Loglinearen Poissonmodell für Kontingenztafeln unter Einbeziehung robuster Schätzer, Dissertation, Fachbereich Statistik, Universität Dortmund (2000). 5.7.2 Strukturerkennung in hochdimensionalen DatensätzenLeitung Prof. Dr. Gather, Ursula Mitarbeit Dipl.-Stat. Paris Scholz, Sebastian Beschreibung Das Ziel dieses Forschungsprojektes ist es, robuste statistische Methoden zur Schätzung von konvexen Körpern zu entwickeln. Ein Beispiel für konvexe Körper sind sogenannte Kontur-Toleranzbereiche, die etwa in komplexen technischen Prozessen Anwendung finden, um Veränderungen des Prozessverhaltens rechtzeitig erkennen zu können. In diesem Projekt werden die Auswirkungen von Ausreißern auf die Schätzung von konvexen Körpern untersucht. Als Ausreißer werden Beobachtungen bezeichnet, die weit entfernt von der Hauptmasse der Daten liegen. Die Gründe für das Auftreten derartiger Beobachtungen können vielfältig sein. Zu nennen sind zum Beispiel Mess- oder Übertragungsfehler, aber auch die Möglichkeit, dass ein Teil der Daten nicht aus der zugrunde liegenden Verteilung stammt. In der Praxis sind derartige Beobachtungen in vielen Datensätzen zu finden. Daher ist es wichtig, deren Effekte auf die Ergebnisse statistischer Analysen zu untersuchen und Verfahren zu entwickeln, die ihren Einfluss begrenzen. Zur Beurteilung solcher Verfahren werden Gütekriterien benötigt. So gibt etwa der Bruchpunkt eines Schätzers den kleinsten Anteil von Beobachtungen einer Stichprobe an, deren Austausch durch beliebige Werte dazu führen kann, dass der Schätzer Werte annimmt, die "beliebig weit" entfernt vom Wert der zu schätzenden Größe liegen. Eine modifizierte Form des Bruchpunkts ermöglicht Robustheitsuntersuchungen bekannter Schätzer von konvexen Körpern und die Konstruktion robuster Schätzer. Zusammenfassend verfolgt diese Arbeit das Ziel, Robustheitskonzepte auf die Schätzung konvexer und kompakter Mengen zu übertragen. Mit Hilfe dieser Konzepte können Schätzer entwickelt werden, die dann bezüglich dieser Kriterien robust sind. Kooperation SFB 475, Fachbereich Chemietechnik (Prof. Dr.-Ing. Sebastian Engell) Förderung DFG Laufzeit 01.08.1999-31.07.2002 5.7.3 Modellbasierte Fehlerdiagnose komplexer Systeme mit Hilfe Bayesscher NetzeLeitung Prof. Dr. Gather, Ursula Mitarbeit Dipl.-Inf. Robers, Ursula Beschreibung Die Fehlerdiagnose komplexer Systeme basiert häufig sowohl auf Expertenwissen als auch auf Daten, die in Form von Meßwerten oder Angaben über durchgeführte Eingriffe des Bedienpersonals vorliegen. Zur Modellierung solcher Systeme ist daher der Einsatz von Verfahren sinnvoll, die beide Informationsformen verarbeiten können. Als besonders erfolgreich hat sich in diesem Zusammenhang insbesondere der Einsatz von Bayesschen Netzen erwiesen. In diesem Projekt wurden folgende Aspekte genauer untersucht: die Einbeziehung sowohl diskreter als auch stetiger Zufallsvariablen, die Evidenztheorie als Grundlage Bayesscher Netze sowie die Verwendung Bayesscher Netze für die Analyse hochdimensionaler Daten. Kooperation SFB 475, Fachbereich Chemietechnik (Prof. Dr.-Ing. Sebastian Engell) Laufzeit 01.04.1996-30.11.1998 5.7.4 Analyse von Umfragedaten und Daten aus selektierten Patientenkollektiven zur Aufdeckung und Aufklärung biomedizinischer Wirkung elektromagnetischer StrahlungLeitung Prof. Dr. Gather, Ursula Mitarbeit Dr. Pawlitschko, Jörg; Dr., Schultze, Verena; Dr., Kuhnt, Sonja Beschreibung Das Thema dieses Projekts war die Gewinnung von Erkenntnissen zu der Frage, ob und in welcher Weise niederfrequente elektromagnetische Felder (EMF), wie sie als Dauerbelastung der Bevölkerung im Wohn- und Schlafbereich häufig anzutreffen sind, als Auslöser von Befindlichkeitsstörungen bis hin zu schweren Krankheitsbildern in Frage kommen. Zur statistischen Analyse standen dabei zwei Datensätze zur Verfügung. Der erste enthält die über mehrere Jahre hinweg gesammelten Daten von Ärzten und Baubiologen, in denen für einzelne Patienten jeweils bestimmte medizinische Parameter sowie die Ergebnisse von im Wohnumfeld vorgenommenen baubiologische Messungen enthalten sind. Auf Basis dieser Daten wurde untersucht, ob sich mögliche Zusammenhänge zwischen der Belastung durch EMF sowie diesen medizinischen Parametern, etwa in Form einer Dosis-Wirkungs-Beziehung, aufzeigen lassen. Herausforderungen aus statistischer Sicht waren die Reichhaltigkeit der Daten sowie der Umstand, daß sie nicht als Ergebnis einer geplanten epidemiologischen Studie zustande gekommen sind. Der zweite Datensatz basiert auf einer Umfrage unter Mitgliedern des Arbeitskreises für Elektrosensible e.V., Bochum, und weiteren Personen, deren Beschwerden von ihnen selbst auf den Einfluß von EMF zurückgeführt werden. Für diese Umfrage wurde ein Fragebogen entworfen, mit dem von den befragten Personen Informationen über Art und Grad ihrer Exponiertheit gegenüber EMF sowie über die subjektive Einschätzung ihrer Befindlichkeit gewonnen wurden. Die Auswertung der eingegangenen Fragebögen ergab Aufschlüsse über den Personenkreis der Elektrosensiblen und erlaubte insbesondere eine Einteilung der Befragten in fünf klar voneinander abgegrenzte Gruppen mit unterschiedlichen Beschwerdeprofilen, die auch hinsichtlich der subjektiven Wahrnehmung von EMF deutliche Unterschiede aufweisen. Kooperation Institut für Mobil- und Satellitenfunktechnik, Kamp-Lintfort; Arbeitskreis für Elektrosensible e.V., Bochum Förderung Land Laufzeit 01.08.1996-31.12.1999 5.7.5 Methoden zur Prozess- und Werkzeugoptimierung für die Blechformteilefertigung mit statistischer Versuchsplanung und Finite-Elemente SimulationLeitung Prof. Dr. Gather, Ursula Mitarbeit Dr. Berghoff, Sonja;Dr. Kuhnt, Sonja Beschreibung Für den Bereich der wirkmedienbasierten Umformverfahren soll eine neue Methode zur Werkzeug- und Prozessauslegung sowie -optimierung erforscht und entwickelt werden, die sich durch eine effiziente und reproduzierbare Vorgehensweise gegenüber der herkömmlichen, durch "trial-and-error" geprägten Methodenplanung auszeichnet. Die Basis bildet die FE-Methode, wobei für die Planung, Vorbereitung und Auswertung der Rechnungen Methodiken der statistischen Versuchsplanung und Qualitätssicherung, speziell auch im Hinblick auf Robustes Parameter Design bei multiplen Qualitätsmerkmalen, weiterentwickelt werden müssen. Kooperation Fachbereich Maschinenbau, Lehrstuhl für Umformtechnik (Prof. Dr.-Ing. M. Kleiner) Förderung DFG allgemein Laufzeit 01.01.2000-31.12.2002 Publikationen Optimierung multipler Qualitätsmerkmale mit statistischen Methoden bei der FE-Simulation von Hochdruck-Blech-Umformprozessen (S. Kuhnt, C. Klimmek, U. Gather, M. Kleiner). In: Simulationsgestützte Offline-Prozessplanung und -optimierung bei der Fertigung von Freiformflächen -Kolloqium 2001-, Forschergruppe 366, Universität Dortmund (2001). 5.8 Lehrstuhl Computergestützte StatistikLeitung Prof. Dr. Weihs, Claus Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-4363, -5853 (Sekretariat), Telefax: 0231 / 755-4387 E-mail: weihs@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/computergestuetzt.html Aufgabe Forschung und Lehre auf dem Gebiet Computergestützte Statistik; Entwicklung von effizienten Computeralgorithmen für statistische Problemstellungen in Theorie und Praxis. Diplom-/ Staatsarbeiten Mindestens 14 Dissertationen 8 Apparative Ausstattung Parallelrechner, PCs 5.8.1 Konzept für eine moderne statistische QualitätssicherungLeitung Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Stat. Jessenberger, Jutta Beschreibung Die statistische Qualitätssicherung hat sich in den letzten Jahrzehnten stark verändert. Am Anfang standen Verfahren zur Eingangs-/ Ausgangsprüfung (acceptance sampling) (Dodge & Romig, 1929). Ziel dieser Verfahren ist die Feststellung von Qualität mit der Konsequenz der Akzeptanz oder Ablehnung von sog. Losen. Dabei können Lose Rohstoffpartien oder produzierte Güter sein. Grundlage der Qualitätsfeststellung ist die Analyse einer möglichst kleinen Stichprobe der fertiggestellten Produkte. Typischerweise findet eine solche Prüfung „off-line“ statt, d. h. losgelöst vom Produktionsprozess, und es wird auch kein Versuch gemacht, abweichende Qualität zu erklären. Mit der Qualitätskontrolle (Statistical Process Control, SPC) setzte sich erst wesentlich später (80er/90er Jahre) die „on-line“ Kontrolle eines Prozesses durch, obwohl sie schon wesentlich früher vorgeschlagen wurde (Shewhart, 1925). Im Gegensatz zu den üblichen Abnahmeprüfungen, die die Tauglichkeit des Loses erst zum Produktionsende („off-line“) feststellen, wird der Prozess dabei regelmäßig während der laufenden Produktion auf Abweichungen der Einstellgrößen und Qualitätsmerkmale von ihren Sollwerten untersucht. Dadurch ergeben sich meist auch Erklärungsversuche für abweichende Qualität. Erst seit kurzem werden verstärkt Versuche unternommen, mit Hilfe der statistischen Versuchsplanung (Design of Experiments, DoE) (Box, 1952, Taguchi, 1976) Prozesse schon während der Planungsphase zu optimieren und sie weniger anfällig gegen Einflussfaktorvariationen zu machen. Noch aktueller sind Versuche, solche optimierten, robustifizierten, kontrollierten Prozesse (und nur solche Prozesse!) durch eine einzige Zahl, einen sog. Prozessfähigkeitsindex (Kane, 1986), zu charakterisieren. Solche Indizes geben an, wie der Prozess in der Praxis im Verhältnis zur Prozessspezifikation variiert. Dadurch charakterisieren sie die „Zuverlässigkeit“ eines Produktes und ersetzen so häufig die Ausgangs-/Eingangsprüfung. Statistische Qualitätssicherung liefert also offenbar wichtige Methoden zur Schaffung, Überwachung und Charakterisierung von Qualität. Z. B. könnte der routinemäßige Einsatz von statistischer Versuchsplanung in der Produktplanung entscheidend dazu beitragen, Fehlerprophylaxe möglichst früh im Produktzyklus einzuführen und so Qualitätsmängel gar nicht erst entstehen zu lassen. In dem Projekt wurde aus diesen Bausteinen ein Konzept für eine moderne statistische Datenanalyse entwickelt (Jessenberger, 1999, Weihs, 1999). Kooperation Dr. Grize, Yves-Laurent, AICOS, Basel Laufzeit 1.1.1995-30.9.1998 Publikationen Jutta Jessenberger (1999): „Prozessfähigkeitsindizes in der Qualitätssicherung“, Libri Books on Demand. Claus Weihs und Jutta Jessenberger (1999): Statistische Methoden zur Qualitätssicherung und –optimierung, Wiley-VCH. 5.8.2 Multivariate Prognosemodelle bei Beobachtungsstudien und experimentellen StudienLeitung Prof. Dr. Kunert, J.; Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Stat. Jessenberger, Jutta; Dipl.-Stat. Steuer, Detlef und Mitarbeiter Kunert Beschreibung s. Teilprojekt A2, SFB 475, Bewilligungsperiode 1997-2000 Förderung DFG, SFB 475 Laufzeit 1.7.1997-30.6.2000 Publikationen s. Teilprojekt A2, SFB 475, Bewilligungsperiode 1997-2000 5.8.3 Statistische Methoden und Maschinelles LernenLeitung Prof. Dr. Gather, Ursula (nur bis 30.6.2000); Prof. Dr. Morik, Katharina; Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Stat. Sondhauß, Ursula und Mitarbeiter von Prof. Gather und Prof. Morik Beschreibung s. Teilprojekt A4, SFB 475 Förderung DFG, SFB 475 Laufzeit 1.7.1997-30.6.2003 Publikationen s. Teilprojekt A4, SFB 475 5.8.4 Multivariate Bestimmung und Untersuchung von KonjunkturzyklenLeitung Prof. Dr. Heilemann, Ullrich (RWI, Essen); Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Math. Dipl.-Phys. Röhl, Michael; Dipl.-Stat. Sondhauß, Ursula und Mitarbeiter von Prof. Heilemann Beschreibung s. Teilprojekt B3, SFB 475 Förderung DFG, SFB 475 Laufzeit 1.7.1997-30.6.2003 Publikationen s. Teilprojekt B3, SFB 475 5.8.5 Strukturoptimierung von Dichteschätzmodellen angewendet auf nichtlineare ZeitreihenanalyseLeitung Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Stat. Busse, Anja Beschreibung Oft tritt das Problem auf, dass die durch einen nichtlinearen Prozess entstandenen Zeitreihen nicht mehr gültig durch globale Modelle, wie z.B. ARIMA-Modelle, beschrieben werden können. Stattdessen ist das Verhalten der Zeitreihe abhängig vom aktuellen Zustand eines Gesamtsystems, das das beobachtete Signal erzeugt. Daher können z.B. Informationen über das zukünftige Verhalten der Zeitreihe nur aus Beobachtungen bei ähnlichen Zuständen des Systems abgeleitet werden. Als eine zu beantwortende Frage ergab sich damit, welches Modell als Grundlage zur Analyse nichtlinearer Zeitreihen geeignet erscheint. Dabei wurde das Verfahren der Diplomarbeit (Reimetz 1998) auf die nichtlineare Zeitreihenanlyse übertragen. Dieses evolutionär basierte Verfahren zur Dichteschätzung stellt die Möglichkeit bereit, aus einer endlichen Stichprobe eine gemeinsame Dichte der beobachteten Zufallsvariablen zu schätzen. Bei der Überprüfung der Übertragbarkeit des Verfahrens auf chaotische oder nichtlineare Zeitreihen entstanden zwei Konferenzartikel, die zum einen die Mehrdimensionalität der Zufallsvariablen (Kreutz 1998), zum anderen die Prognose gestörter chaotischer Zeitreihenvariablen (Kreutz 1999) untersuchen. Kooperation Institut für Neuroinformatik, Ruhr-Universität Bochum Förderung Stipendium für Forschungszwecke Laufzeit 01.02.1998 - 28.02.1999 Publikationen Martin Kreutz and Anja M. Reimetz and Bernhard Sendhoff and Claus Weihs and Werner von Seelen (1998):"Optimisation of Density Estimation Models with Evolutionary Algorithms", in "Parallel Problem Solving from Nature -- PPSN V", Eds.: Eiben, A.E. and Bäck, Th. and Schoenauer, M. and Schwefel,H.-P., Lecture Notes in Computer Science 1498,Springer. Martin Kreutz and Anja M. Reimetz and Bernhard Sendhoff and Claus Weihs and Werner von Seelen (1999): "Structure optimization of density estimation models applied to regression problems with dynamic noise", in: "Uncertainty'99: Proceedings of the Seventh International Workshop on Artificial Intelligence and Statistics", Eds.: David Heckerman and Joe Whittaker, Morgan Kaufmann. Anja M. Reimetz (1998): "Strukturbestimmung von probabilistischen neuronalen Netzen mit Hilfe von Evolutionären Algorithmen“, Diplomarbeit, Fachbereich Statistik, Universität Dortmund. 5.8.6 Statistische Versuchsplanung von chemotaxonomischen UntersuchungenLeitung Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Math. Theis, Winfried Beschreibung Dieses Projekt ist ein Teilprojekt im Rahmen eines Forschungs- und Entwicklungsvorhaben des Umweltbundesamtes zur Untersuchung des Eintrags von Antibiotika in die aquatische Umwelt. Das Institut für Umweltmedizin und Krankenhaushygiene der Universität Freiburg möchte mit chemotaxonomischen Methoden den Einfluss von Antibiotika in Krankenhausabwässern auf die Leistungsfähigkeit einer kommunalen Kläranlage bestimmen. Dazu beschäftigt sich dieses Teilprojekt mit der Erstellung und Entwicklung von geeigneten statistischen Versuchsplänen. Besondere Schwierigkeiten bereitet dabei die geringe Anzahl technisch realisierbarer Experimente und Messungen der chemotaxonomischen Parameter. Bei diesen Parametern handelt es sich um Stoffe (Chinone, Polyamine und Lipide), die als sogenannte Biomarker für bestimmte Bakterien herangezogen werden können und sich damit auch die Menge der vorhandenen Bakterien einer bestimmten Gattung im Klärschlamm bestimmen lässt. Eine weitere Herausforderung in diesem Zusammenhang ist die latent vorhandene Autokorrelation der Beobachtungen, die sich jedoch aufgrund der geringen Messdichte Schlecht modellieren lässt. Kooperation PD Dr. Kümmerer, Klaus, Institut für Umweltmedizin und Krankenhaushygiene, Universität Freiburg Förderung UBA FKZ 298 63 722 und Graduiertenkolleg „Angewandte Statistik“ Laufzeit 1.1.2000-31.1.2003 5.8.7 Statistik und MusikLeitung Prof. Dr. Weihs, Claus Mitarbeit Dipl.-Stat. Ligges, Uwe Beschreibung Ziel dieses Projekts ist die automatische Klassifizierung von Gesangsinterpretationen bezüglich Tonreinheit und verschiedener Klangeigenschaften. Erste Ergebnisse wurden in einem Praktikum im WS 1999/2000 erzielt. Darauf basieren eine Veröffentlichung und drei Diplomarbeiten. Weitere Ergebnisse zur 'Automatic Classification of Vocal Performance' wurden auf dem Second International Seminar on Mathematical Music Theory im Jahre 2001 in Sauen (Brandenburg) vorgestellt. Kooperation Petra Hasse-Becker, Institut für Musik und ihre Didaktik, Universität Dortmund. Laufzeit 01.04.1999 - 30.09.2004
Publikationen Ligges, U. (2000): Identifikation lokal stationärer Anteile in Gesangszeitreihen, Diplomarbeit, Fachbereich Statistik, Universität Dortmund, September 2000. 5.8.8 Analyse und Modellbildung des Tiefbohrprozesses mit Methoden der Statistik und Neuronalen NetzenLeitung Prof. Dr. von Seelen, Werner (Institut für Neuroinformatik, Ruhr-Universität Bochum); Prof. Dr. Weihs, Claus; Prof. Dr. Dr. h.c. Weinert, Klaus Mitarbeit Dipl.-Math. Theis, Winfried und Mitarbeiter von Prof. von Seelen und Prof. Weinert Beschreibung s. Teilprojekt C5, SFB 475 Förderung DFG, SFB 475 Laufzeit 1.7.2000-30.6.2003 5.9 Fachgebiet Statistik in den BiowissenschaftenLeitung Priv. Doz. Dr. Ickstadt, Katja Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3111, Telefax: 0231/755-5930 http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/biowissenschaften.html Aufgabe Lehre und Forschung Diplom-Staatsarbeiten 2 Dissertationen 4 5.10 Fachgebiet Statistische Methoden in der Genetik und ÖkologieLeitung Prof. Dr. Urfer, Wolfgang Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3121, Telefax: 0231/755-5303 urfer@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/einrichtungen/lehrstuehle/genetik.html Aufgabe Lehre und Forschung; Methoden zur Auswertung von Daten aus der Genetik und Ökologie Forschungstätigkeit Entwicklung und Anwendung statistischer Methoden zur Auswertung von Daten und interdisziplinären Projekten der Genetik, Toxikologie und Ökosystemforschung. Dabei spielen neuartige genetische Markersysteme in der Pflanzenzüchtung und in der Humangenetik eine besondere Rolle bei der Lokalisation von Genen und der Bestimmung ihrer Wirkung auf phänotypische Merkmale. Solche Markersysteme (DNA-Adukte) spielen auch in der Krebsforschung eine besondere Rolle. Diplom-Staatsarbeiten 21 Dissertationen 4
5.11 Sonderforschungsbereich 475 - Komplexitätsreduktion in multivariaten DatenstrukturenLeitung Prof. Dr. Gather, U. Kontakt Vogelpothsweg 87 (Mathematikgebäude, Campus Nord) 44227 Dortmund (Postanschrift: 44221 Dortmund) Telefon: 0231/755-3110, Telefax: 0231/755-5417 sfb475-z@statistik.uni-dortmund.de http://www.statistik.uni-dortmund.de/de/content/forschung/einrichtungen/sfb475.html Aufgabe Der Sonderforschungsbereich 475 "Komplexitätsreduktion in multivariaten Datenstrukturen" besteht an der Universität Dortmund seit dem ersten Juli 1997.Wissenschaftler der Fachgebiete Statistik, Informatik, Maschinenbau, Wirtschaftswissenschaften, Mathematik, Biometrie und Medizin der Universitäten Dortmund (Sprecherhochschule), Essen, Wuppertal und vom RWI Essen sowie dem Institut für Arbeitsphysiologie, Dortmund, arbeiten im SFB interdisziplinär zusammen. Forschungstätigkeit Hauptziel des SFB ist die Erforschung datenorientierter Modellbildung für komplexe Problemstellungen und Systeme unter Ausnutzung der Interaktion methodischer Innovationen auf der einen und datenintensiven Anwendungen in Biologie und Ökonomie auf der anderen Seite. Diplom-/ Staatsarbeiten ca. 60 Dissertationen 12 Habilitationen 3 5.11.1 SFB 475, Teilprojekt A1: Robuste Modellbildung und DimensionsreduktionLeitung Prof. Dr. Gather, U.; Prof. Dr. Davies, L. (Universität Essen) Mitarbeit Dr. Becker, C. ; Dr. Pawlitschko, J.; Dr. Schultze, V.; Dr. Kuhnt, S.; Dr. Christmann, A. Beschreibung In etlichen statistischen Anwendungsgebieten werden Merkmale erhoben, die von vielen verschiedenen Einflüssen abhängig sind. Dazu zählen Größen, die in Prozessen industrieller Fertigung erhoben werden, ebenso wie ökonomische, biologische und medizinische Merkmale, wie sie in den Teilprojekten der Projektbereiche B und C untersucht werden. Solche Strukturen werden häufig zunächst durch mathematische Modelle mit Parameterräumen und Regressoren von hoher bis extrem hoher Dimension beschrieben. Viele etablierte statistische Methoden können dann jedoch aufgrund des so genannten "Fluchs der Dimension" nicht angewendet werden, obwohl sie wünschenswerte theoretische Eigenschaften besitzen. Andererseits verbirgt sich oft in hochdimensionalen Daten eine Struktur von deutlich niedrigerer Dimension, die zur Modellierung ausreicht. Die Entdeckung dieser Struktur und die damit einhergehende Reduzierung der Dimension ist somit ein wichtiges statistisches Ziel. Dabei ist zu beachten, dass gerade in hochdimensionalen Daten Abweichungen, wie sie zum Beispiel durch Ausreißer gegeben sind, schwer zu erkennen sind, so dass robuste dimensionsreduzierende Verfahren benötigt werden. Nachdem mit entsprechenden Methoden eine Dimensionsreduktion erreicht worden ist, besteht der nächste Schritt darin, den gewünschten Sachzusammenhang im nunmehr reduzierten Raum geeignet zu modellieren. Dazu werden geeignete robuste Methoden zur Modellwahl und zur Schätzung der Modellparameter benötigt. Insbesondere sind Verfahren der nichtparametrischen Regression und auch der Dichteschätzung weiterzuentwickeln, die anhand gewisser, vom Anwendungsgebiet abhängiger Eigenschaften der Zielfunktion geeignete Schätzungen ermöglichen (so etwa unter Berücksichtigung der Anzahl lokaler Extrema bei der Schätzung einer Regressionsfunktion oder der Modalwerte bei einer Dichteschätzung). Das Ziel der robusten Modellbildung und damit der Komplexitätsreduktion bei hochdimensionalen Datenstrukturen wird in diesem Projekt durch zwei miteinander verknüpfte Forschungsstränge angestrebt: Durch Analyse bestehender dimensionsreduzierender statistischer Verfahren (die sich als nicht robust herausstellen) und deren Robustifizierung, bzw. durch die Konstruktion völlig neuer dimensionsreduzierender und zugleich robuster Methoden. Dazu werden als Grundlage neue robuste Verfahren z. B. zur Erkennung von Ausreißern benötigt. Durch die Entwicklung neuer nichtparametrischer Techniken zur robusten Modellwahl und zur Regressions- und Dichteschätzung. Dafür geeignete Methoden liegen im eindimensionalen Fall bereits vor sie sollen auf die mehrdimensionale Situation übertragen werden. Kooperation Universität Essen; Prof. Dr. Laurie Davies Förderung 65 02 001, 65 02 00 ; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Becker, C., Gather, U. (1999), "The Masking Breakdown Point of Multivariate Outlier Identification Rules," Journal of the American Statistical Association, 94, 947-955. Christmann, A. (1999), “On Group Sequential Tests Based on Robust Location and Scale Estimators in the Two-Sample Problem,“ Computational Statistics, 14, 339-353. Christmann, A., Rousseeuw, P. (2001), “Measuring Overlap in Logistic Regression“, Computational Statistics & Data Analysis, 37, 65-75. Davies, P.L. (1998), "On Locally Uniformly Linearizable High Breakdown Location and Scale Functionals," Annals of Statistics, 26, 1103-1125. Davies, L., Kovac, A. (2001), “Local Extremes, Runs, Strings and Multiresolution“, Annals of Statistics 29, 1-65. Gather, U., Becker, C. (1998), "Convergence Rates in Robust Multivariate Outlier Identification," Results in Mathematics, 34, 101-107. Gather, U., Pawlitschko, J. (1999), "Estimating the Survival Function under a Generalized Koziol-Green Model with Partially Informative Censoring,” Metrika, 48, 189-208. Gather, U., Schultze, V. (1999), "Robust Estimation of Scale of an Exponential Distribution," Statistica Neerlandica, 53, 327-341. Pawlitschko, J. (2000), “Estimation in the Koziol-Green Model with Left-truncated Observations“, Sankhya A, 62, 67-79. Terbeck, W., Davies, P.L. (1998), "Interactions and Outliers in the Two-way Analysis of Variance," Annals of Statistics, 26, 1279-1305. 5.11.2 SFB 475, Teilprojekt A2: Effiziente Modellbildung durch Optimale VersuchsplanungLeitung Prof. Dr. Kunert, J.; Prof. Dr. Weihs, C.; Prof. Dr. Dette, H. (Ruhr-Universität Bochum) Mitarbeit Dr. Lehmkuhl, F.; Dipl.-Stat. Meyners, M. Beschreibung Ökologische, biologische, und ökonomische Zusammenhänge werden oft durch statistische Modelle mit hochdimensionalen Einflussgrößen beschrieben. Eine bewährte Methode zur Komplexitätsreduktion ist die statistische Versuchsplanung. Durch statistische Experimente können Ursache–Wirkungsbeziehungen auch bei komplexen Fragestellungen geklärt werden. Werden die Versuche gut geplant, so wird die statistische Auswertung entscheidend vereinfacht. Das wichtigste statistische Problem am Beginn der Analyse komplexer Datenstrukturen ist zunächst die Bestimmung eines statistischen Modells, das die Zusammenhänge adäquat beschreibt. Einerseits ist dabei die Identifikation eines geeigneten Modells aus einer gegebenen Teilklasse von Modellen mit ähnlichen Eigenschaften von Interesse (Modelldiskriminierung), anderseits ist bei der Anwendung die Adäquatheit eines gegebenen Modells stets in Frage zu stellen (Modellvalidierung), da die zur Datenanalyse verwendeten Verfahren nur unter bestimmten Modellannahmen zulässig sind. Für die Modellannahmen ist auch zu berücksichtigen, dass die Art der Versuchsplanung die möglichen Modelle einschränkt. Eine Möglichkeit, diese Zusammenhänge zu beschreiben, liefert die Randomisationstheorie (siehe Hinkelmann und Kempthorne, 1994). Weiter ist eine Modellreduktion (d. h. die Identifikation signifikanter Effekte) von besonderem Interesse, um die zugrunde liegenden Strukturen mit möglichst wenigen Parametern zu beschreiben und die für die Zielgröße relevanten Faktoren zu extrahieren. Die Entwicklung statistischer Analyseverfahren für die Modell-Diskriminierung, -Validierung und -Reduktion ist schon relativ weit fortgeschritten und in Lehrbüchern dokumentiert (siehe z. B. Atkinson, 1994, Box und Draper, 1986, Hastie und Tibshirani, 1990, Cook und Weisberg, 1995, Hart, 1997). Dagegen steht die Entwicklung einer statistischen Versuchsplanung für Auswertungsmethoden bei komplexen Datenstrukturen erst am Anfang der Entwicklung. Hier beschäftigt sich der größte Teil der Literatur in der optimalen Versuchsplanung mit der Annahme eines gegebenen, festen Modells (siehe z. B. die Lehrbücher von Silvey, 1980, Pukelsheim, 1993, Atkinson und Donev, 1992, Shah und Sinha, 1989). Wir haben in diesem Projekt diese Entwicklung weiter vorangetrieben und uns daher mit folgenden Fragestellungen der Versuchsplanung beschäftigt: Fragen der Modelladäquatheit: Lassen sich gegebene Modelle durch Randomisation rechtfertigen? Ist eine Reduktion des Modells möglich? Sind erkannte Modellverletzungen relevant, bzw. wie muss der Versuch geplant werden, damit befürchtete Modellverletzungen möglichst wenige Auswirkungen haben? Bestimmung optimaler Versuchspläne in komplexen Modellen. Hier wurden insbesondere Response Surface Modelle, multivariate nichtlineare Modelle, aber auch lineare Modelle mit Nachbarstrukturen behandelt. Konstruktion von Algorithmen für die Bestimmung von Versuchsplänen und Simulationen von Randomisationsverteilungen. Kooperation Ruhr-Universität Bochum; Prof. Dr. Holger Dette Förderung 65 02 002, 65 02 009; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Dette, H. und Franke, T. (2000), "Constrained D- and D1 Optimal Design for Polynomial Regression“, Annals of Statistics 28, 1702 – 1727. Dette, H., Munk, A. und Wagner, T. (1999), "A review of variance estimators with extensions to multivariate nonparametric regression", in: Multivariate Statistics, Design and Sampling, S. Ghosh (ed.), Dekker, New York. Jessenberger, J. und Weihs, C. (2000), „A Note on the Behaviour of the Process Capability Index Cpmle with asymmetric Specification Limits“, Journal of Quality Technology, 32, 440 - 443. Kunert, J. (1998): On the analysis of circular balanced crossover designs. Journal of Statistical Planning and Inference 69, 359 – 370. Kunert, J. (1998): Sensory Experiments as Crossover Studies. Food Quality and Preference 9, 243 – 253. Kunert, J. (2000): Randomization of Neighbour Balanced Designs. Biometrical Journal 42, 111 – 118. Kunert, J. und Martin, R.J. (2000): Optimality of Type I Orthogonal Arrays for Crossover Models with Correlated Errors. Journal of Statistical Planning and Inference 87, 119 – 124. Kunert, J. und Meyners, M. (1999): On the Triangle Test with Replications. Food Quality and Preference 10, 477 – 482. Meyners, M., Kunert, J. und Qannari, E.M. (2000): Comparing Generalized Procrustes Analysis and STATIS. Food Quality and Preference 11, 77 – 83. Voß, B., Dahms, S., Kuhnert, J. und Weiß, H. (2000), „A Multinational Model for the Quality Control of Colony Counting Procedures“, Biometrical Journal 42, 263 - 278. Weihs , C. und Jessenberger, J. (1999), Statistische Methoden zur Qualitätssicherung und -optimierung in der Industrie“, Wiley - VCH, Weinheim. 5.11.3 SFB 475, Teilprojekt A3: Inferenz in Modellen mit variabler KovarianzstrukturLeitung Prof. Dr., Hartung, J. Mitarbeit Dr., Böckenhoff, A.; Dr. Eberl, W.; Dr. Knapp, G.; Dipl.-Stat. Weimann, B. Beschreibung Die Schwerpunkte des Forschungsprojekts liegen zum einen in der Herleitung von Varianzschätzern für verschiedene Modelle mit variabler Kovarianzstruktur und zum anderen in der Konstruktion von Testverfahren und Konfidenzintervallen für die Modellparameter. Die Varianzschätzer müssen hierbei zulässig sein, d.h. mit Wahrscheinlichkeit Eins nichtnegative sowie ordnungserhaltende Schätzwerte liefern. Bei einer statistischen Analyse zerfällt die Gesamtvariation in mehrere Komponenten, falls mehrere Variationsursachen zu berücksichtigen sind. Für diese Komponenten sind in der Regel auch Beziehungen oder Ordnungen bekannt, die jedoch von den üblichen Schätzfunktionen nicht berücksichtigt werden, so dass eine einzelne Varianzkomponente größer als die gesamte Varianz geschätzt werden kann. In reinen Varianzkomponentenmodellen vom kommutativ quadratischen Typ existieren (exakte) Tests nur für eine begrenzte Anzahl von linearen Hypothesen über Varianzkomponenten. Häufig wird daher auf approximative Verfahren zurückgegriffen. Bei Varianzkomponentenmodellen, die nicht vom kommutativ quadratischen Typ sind - dies sind häufig unbalancierte Modelle - ist die Anzahl der Hypothesen, für die exakte Tests bzw. Konfidenzintervalle existieren, noch weiter eingeschränkt, so dass in der Regel approximative Verfahren zu nutzen sind. Bei Regressionsmodellen mit linearer Kovarianzstruktur in den Varianzkomponenten werden für das Testen linearer Hypothesen über die Regressionsparameter approximative F-Tests verwendet, die auf dem gewöhnlichen Kleinste-Quadrate-Schätzer oder auf dem verallgemeinerten Kleinste-Quadrate-Schätzer für die Regressionsparameter beruhen, wobei im letzteren Fall unterschiedliche Schätzprinzipien für die Kovarianzmatrix des Modells benutzt werden. Förderung 65 02 003; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2000 Publikationen Böckenhoff, A., und Hartung, J. (1998), "Some corrections of the significance level in meta-analysis", Biometrical Journal, 40, 937-947. Hartung, J. (1999), "A short-cut method for computing positive variance component estimates" In: F. Krumm und V.S. Schwarze (Eds.): Quo vadis geodesia ...? - Festschrift for Erik W. Grafarend on the occasion of his 60th birthday (Part 1), Schriftenreihe der Institute des Studiengangs Geodäsie und Geoinformatik – Technical Reports Department of Geodesy and Geoinformatics (Report Nr. 1999.6-1), Universität Stuttgart, 151-154. Hartung, J. (1999), "Ordnungserhaltende positive Varianzschätzer bei gepaarten Messungen ohne Wiederholungen". Allgemeines Statistisches Archiv, 83, 230-247. Hartung, J. (1999), "A note on combining dependent tests of significance". Biometrical Journal, 41, 849-855. Hartung, J. (1999), "An alternative method for meta-analysis". Biometrical Journal, 41, 901-916. Hartung, J., und Knapp, G. (1998), "Messen faserförmiger Partikel. Strategie zur Auswertung des ersten VDI-Ringversuches zur Asbestfaserbestimmung nach Richtlinie VDI 3492 Blatt 1", Allgemeines Statistisches Archiv, 82, 312-326. Hartung, J., und Knapp, G. (1999), "Eine Re-Analyse der Blue Mountains Eye Study zum Kataraktrisiko durch inhalative Kortikoide." Pneumologie, 53(9), 411-416. Hartung, J., und
Knapp, G. (2000), "Confidence intervals for the between group variance in
the unbalanced one-way random effects model of analysis of variance", Hartung, J., und Knapp, G. (2000), "Asymptotic tests for general linear hypotheses on variance components in models of commutative quadratic type", Statistics, Vol. 35, 23-44. Hartung, J., und Voet, B. (1999), "Some variants for testing linear hypotheses on variance components", in: W. Gaul und M. Schader (Hrsg.): Mathematische Methoden der Wirtschaftswissenschaften - Festschrift für Otto Opitz, Physica-Verlag, Heidelberg, 130-140. 5.11.4 SFB 475, Teilprojekt A4: Statistische Methoden und maschinelle LernverfahrenLeitung Prof. Dr. Morik, K.; Prof. Dr. Weihs, C. Mitarbeit Dipl.-Inform. Rüping, S.; Dipl.-Stat. Garczarek, U. Beschreibung In diesem Teilprojekt geht es weiterhin darum, die unterschiedlichen Techniken und Erfahrungen aus Statistik und maschinellem Lernen so zusammenzuführen, dass reale Datenbanken ausgewertet werden können. In der zweiten Antragsphase soll die Forschungsarbeit explizit den gesamten Prozess der Wissensentdeckung in großen, bereits existierenden Datenbanken - das so genannte Knowledge Discovery in Databases (KDD) - umfassen. Die meisten Experten stimmen darin überein, dass gerade die zur Datenbereinigung und zur Datentransformation vor dem Einsatz einer der klassischen Data Mining Methoden nötigen Arbeitsschritte entscheidend für den Erfolg einer KDD-Anwendung sind. Zudem zählen sie mit gut 80% der Gesamtlaufzeit eines KDD-Projektes zu den aufwÄndigsten. Eines der wichtigsten Ziele besteht nun darin, bisher ad hoc durchgeführte Schritte innerhalb des KDD Prozesses auf ein theoretisches Fundament zu setzen. Aufbauend auf den Ergebnissen der ersten Antragsphase sollen die wichtigsten ursprünglichen Ziele beibehalten werden. Zum einen ist dies die vergleichende Analyse von Verfahren zur Lösung derselben Aufgabe aus beiden Disziplinen, zum anderen die Verzahnung der Methoden aus Statistik und maschinellem Lernen. Da nun der gesamte KDD-Prozess ins Blickfeld gerückt ist, wird es hierbei nicht nur um die klassischen Analysemethoden im Kern des Wissensentdeckungsprozesses gehen, sondern auch um Methoden zur Datenbereinigung und zur Datentransformation. Bei der vergleichenden Beurteilung von Verfahren erzwingt die KDD-Sicht die Berücksichtigung neuer, oft erst noch zu formalisierender Güteaspekte: Neben der Genauigkeit der Ergebnisse müssen z. B. auch ihre Erstellungsdauer, Interessantheit, Interpretierbarkeit und Verständlichkeit in die Bewertung eingehen. Ebenfalls sollen die Erstellungskosten und die Leichtigkeit, mit der ein Ergebnis als Eingabe eines anderen Verfahrens genutzt werden kann, mit (natürlich disziplinenübergreifend einsetzbaren) Gütekriterien bewertet werden. Die Entwicklung bester Verfahren entspricht demnach einer Optimierung der Ergebnisse mit Mehrfachzielsetzung. Zum Vergleich von Klassifikationsverfahren kommen in dieser Antragsphase komparative Studien bezüglich weiterer Methoden zur Dimensions- und Komplexitätsreduktion hinzu. Dies sind zum einen Methoden zur Feature Selection und Feature Construction bzw. zur Variablenselektion und Bestimmung von latenten Variablen. Zum anderen spielen Methoden der Datentransformation, die bei großen Datenbanken eine geeignete Auswahl von Beispielen für eine schnelle Analyse treffen können, eine wichtige Rolle. In diesem Projekt wird die Nutzung von Stützvektoren, Stichprobenverfahren und statistischer Versuchsplanung zu diesem Zweck untersucht. Die Verzahnung von Methoden soll erreicht werden, indem für jeden Arbeitsschritt im KDD-Prozess beste Verfahren miteinander kombiniert werden. Speziell muss untersucht werden, inwiefern das Ergebnis eines Verfahrens als Eingabe für den jeweils nächsten Schritt geeignet ist. Insgesamt sollen in diesem Teilprojekt disziplinäre Grenzen von Statistik und maschinellem Lernen überwunden werden und ein neuer Typ von KDD-Verfahren entwickelt werden, der mehr leistet als die besten jetzigen Verfahren aus den einzelnen Disziplinen. Förderung 65 02 007, 65 02 008 ; DFG Sonderforschungsbereich Kooperation Fachbereich Informatik; Prof. Dr. Katharina Morik, Lehrstuhl Informatik VIII Laufzeit 01.07.1997 - 30.06.2003 Publikationen Armstrong, R., Freitag, D., Joachims, T. und Mitchell, T.M. (1998), "WebWatcher: A Learning Apprentice for the World Wide Web", in: Machine Learning and Data Mining, R. Michalski, I. Bratko und M. Kub at (eds.), Wiley, 297-312. Brockhausen, P. und Morik, K. (1998), "Wissensentdeckung in relationalen Datenbanken: Eine Herausforderung für das Maschinelle Lernen", in: Data Mining, theoretische Aspekte und Anwendungen, G. Nakhaeizadeh (ed.), Wirtschaftsinformatik, Physica Verlag, 193-211. Joachims, T. (1999), "Making Large-Scale SVM Learning Practical", in Advances in Kernel Methods - Support Vector Learning: B. Schölkopf and C. Burges and A. Smola (eds.), MIT-Press, 169-184. Morik, K. und Brockhausen, P. (1997), "A Multistrategy Approach to Relational Knowledge Discovery in Databases", Machine Learning Journal, 27, 287-312. Morik, K., Kaiser, M., Klingspor, V. (1999), "Making robots smarter - combining sensing and action through robot learning", Kluwer. Joachims, T. und Mlademic, D. (1998), "Browsing-Assistenten, Tour Guides und adaptive WWW-Server", Künstliche Intelligenz, 3, 23-29. 5.11.5 SFB 475, Teilprojekt A5: Komplexitätstheorie und Algorithmen in der StatistikLeitung Prof. Dr. Gather, U.; Prof. Dr. Wegener, I. Mitarbeit Dipl.-Stat. Fender, T.; Dipl.-Inform. Bernholt, T. Beschreibung Moderne statistische Verfahren zur Komplexitätsreduktion in multivariaten Datenstrukturen sollen Daten so verarbeiten, dass die Datenquantität möglichst stark abnimmt und gleichzeitig die Datenqualität, also ihr Informationsgehalt entweder global oder bezogen auf eine konkrete Zielsetzung, möglichst wenig abnimmt. Dabei müssen die verwendeten Verfahren allerdings im Sinne der benötigten Rechner- bzw. Zeitkapazität auch effizient durchführbar sein. Es setzt sich sogar immer mehr die Auffassung durch, dass eine statistische Prozedur nicht schon dann als etabliert gelten kann, wenn sie theoretisch korrekt hergeleitet und asymptotisch effizient ist, sondern erst, wenn sie auch mittels eines probaten Algorithmus implementiert ist. Insbesondere ergibt sich für die in den anderen Teilprojekten relevanten und neu entwickelten Verfahren häufig die Notwendigkeit einen Algorithmus neu zu entwickeln bzw. dahingehend zu verbessern, dass er gleichzeitig die statistische Theorie korrekt umsetzt und aus der Sicht der Theoretischen Informatik effizient ist. Dies impliziert nicht zuletzt eine Abwägung zwischen Effizienzgewinn und Kosten mit Hilfe einer Untersuchung der algorithmischen Komplexität der statistischen Verfahren. Aus dieser Sicht ist es notwendig die SFB-Thematik nicht nur aus einem statistisch methodischen, sondern auch aus einem algorithmisch orientierten Blickwinkel zu betrachten. Daraus ergeben sich die Zielsetzungen dieses Teilprojekts:
Langfristig soll die Verfolgung dieser Zielsetzung zur Aufdeckung algorithmischer Prinzipien für statistische Methoden der Komplexitätsreduktion und zur Entwicklung von Meta-Algorithmen führen. Es liegt auf der Hand, dass sich dieses Ziel nur durch Kooperation verwirklichen lässt, und zwar von Statistikern, die sich mit den im SFB behandelten Problemen und Verfahren, insbesondere auch der Problemmodellierung, auskennen, und Informatikern, die sich auf die Gebiete Komplexitätstheorie und Effiziente Algorithmen spezialisiert haben. Kooperation Lehrstuhl Informatik II: Effiziente Algorithmen und Komplexitätstheorie, Prof. Dr. Ingo Wegener Förderung 65 02 010, 65 02 011 ; DFG Sonderforschungsbereich Laufzeit 01.07.2000 - 30.06.2003 Publikationen Bernholt, T., Fischer, P. (2001), “The Complexity of Computing the MCD-Estimator”, eingereicht in Theoretical Computer Science. Becker, C., Gather, U. (1999), “The Masking Breakdown Point of Multivariate Outlier Identification Rules”, Journal of the American Statistical Association, 94, 947-955. Gather, U., Wellmann, J. (1999), “A note on Contamination Models and Outliers”, Communications in Statistics – Theory and Methods, 28, 1793-1802. Wegener, I. (2000), “Branching Programs and Binary Decision Diagrams – Theory and Applications”, SIAM-Monographs in Discrete Mathematics and Applications, SIAM, Philadelphia. 5.11.6 SFB 475, Teilprojekt B1: Kapitalmarktpreise als Frühindikatoren ökonomischer Strukturbrüche und TrendsLeitung Prof. Dr. Krämer, W.; Prof. Dr. Davies, L. Mitarbeit Dr. Kleiber, C.; Dipl.-Stat. Lohre, M.; Dr. Sibbertsen, P. Beschreibung Das Projekt führt die in der ersten Phase begonnenen Untersuchungen zur Effizienz des deutschen Kapital- und speziell Aktienmarkts durch die Untersuchung der folgenden Fragen fort: 1) Wie verhalten sich Standardtests auf Kapitalmarkteffizienz bei Abweichungen von den Idealbedingungen (etwa Einheitswurzeltests auf den I(1)-Charakter von Finanzzeitreihen bei fehlspezifizierten stochastischen Prozessen oder bei Renditen mit unendlicher Varianz)? Kann man die Güte von Standardtests verbessern? 2) Inwieweit sind Aktienrenditen von Einzelfirmen im Querschnitt zur Zeit aus Bilanzdaten und anderen Firmencharakeristiken vorhersagbar? Die erste Frage ist statistisch-methodischer Natur. Sie wird u. A. durch verschiedene in früheren DFG-Projekten gewonnene Erkenntnisse des Inhalts motiviert, dass viele statistische Standardannahmen bezüglich Null- und Alternativverteilungen von Kapitalmarktdaten in der modernen Börsenpraxis ganz offensichtlich nicht gegeben sind. Die zweite Frage hat eher empirischen Charakter; ihre Bedeutung folgt unmittelbar aus der großen Bedeutung einer korrekten Risikobewertung für Finanzmärkte und Wirtschaftspolitik. Der Zusammenhang mit dem Generalthema des Sonderforschungsbereichs wird durch die zentrale Rolle effizienter Kapitalmärkte und "gerechter" Kapitalmarktpreise als die großen Zusammenfasser bewertungsrelevanter Wirtschaftsdaten hergestellt: Die Preise eines effizienten Marktes spiegeln alle Informationen zu künftigen Nachfrage- und Absatzverläufen, Rohstoffknappheiten und technischem Fortschritt wieder, über die die Wirtschaftsakteure im Augenblick der Risikobewertung verfügen. Insofern wird also ein unbestritten sehr komplexer Sachverhalt in einem erheblich niedrigerdimensionalen Preisvektor erfasst. Kooperation Universität Essen; Prof. Dr. Laurie Davies Förderung 65 03 001, 65 03 007; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Davies L. und Krämer W. (2000): The Dickey-Fuller-test for exponential random walks, Technical Report 29/2000, SFB 475, Universität Dortmund. Krämer W. (1998): Fractional integration and the augmented Dickey-Fuller Test, Economics Letters 61, 269 - 272. Krämer W. (1998): Short-term predictability of German stock returns, Empirical Economics 23, 635 - 639. Krämer W. (1999): Kointegration von Aktienkursen, Zeitschrift für betriebswirtschaftliche Forschung 51, 915-936. Krämer W. und Davies L. (2002): Testing for unit roots in the context of misspecified logarithmic random walks, Technical Report 30/2000, SFB 475, Universität Dortmund. Krämer W. und Haßler U. (1998): Limiting efficiency of OLS vs. GLS when regressors are fractionally integrated, Economics Letters 60, 285 - 290. Krämer W. und Runde R. (1998): Diagnostic checking in linear processes with infinite variance, Technical Report 8/98, SFB 475 Universität Dortmund. Krämer W. Runde, R. (2000): Peaks or tails - What distinguishes financial data?, Technical Report 8/99, SFB 475 Universität Dortmund. Krämer W., Sibbertsen P. (2000): Testing for structural change in the presence of long-memory, Technical Report 21/2000, SFB 475, Universität Dortmund. Sibbertsen P. (1999): Robuste Parameterschätzung im linearen Regressionsmodell bei Fehlertermen mit langem Gedächtnis, Verlag für Wissenschaft und Forschung, Berlin (Dissertation). 5.11.7 SFB 475, Teilprojekt B2: Multivariate Prognosesysteme in der Warenwirtschafts- und ProduktionssteuerungLeitung Prof. Dr. Krämer, W.; Prof. Dr. Arminger, G. (Universität Wuppertal) Mitarbeit Dipl.-Stat. Schneider, C. Beschreibung Bei der betrieblichen Leistungserstellung stellen Warenwirtschafts- und Produktionssteuerungssysteme entscheidende Faktoren dar. Die Leistungsfähigkeit dieser Systeme basiert wesentlich auf Unternehmensdaten, die innerbetrieblich vernetzt sind und sowohl Unternehmensfunktionen als auch Entscheidungssituationen beeinflussen. Die zeitabhängigen Größen wie Absatz, Umsatz und Produktionsentwicklung spielen dabei eine große Rolle. Sie werden bisher nicht mit ausreichender Qualität prognostiziert, um auf dieser Basis fundiert Entscheidungen treffen zu können. Die aus der statistischen Zeitreihenanalyse bzw. der Ökonometrie kommenden Prognoseverfahren sind teilweise nicht ohne Vorarbeit anzuwenden bzw. weisen für die Praxis an einigen Stellen Schwächen auf. Typische Probleme sind:
Nicht vorhandene oder unzureichende Schnittstellen zu bestehenden Systemen der Bestandsführung bzw. allgemeiner der Warenwirtschaft und der Produktionssteuerung,
Für Einzelne dieser Probleme bestehen bereits Teillösungen oder sind mit geringem Aufwand aus der klassischen Zeitreihenanalyse zu ermitteln, so z. B. zum raschen Reagieren auf neue Artikel mittels exponentieller Glättung höherer Ordnung oder die Prognose unter Berücksichtigung von Kalendereffekten mittels ARX-Modellen. Aber das gleichzeitige Auftreten mehrerer Probleme bereitet Schwierigkeiten, insbesondere die Automatisierung der Prognoseerstellung. Zwar lassen sich genaue Zeitreihenanalysen mit der Box-Jenkins-Methodologie durchführen, dies ist aber aufgrund der großen Zahl der Zeitreihen kein praktikabler Weg. Ziel muss es sein, die Prognosen zu automatisieren und mit autoadaptiven Modellen zu berechnen, wobei im Interesse robuster, automatischer Prognosen im Einzelfall suboptimale Vorhersagen in Kauf genommen werden. Die vorliegenden Software-Lösungen zur automatischen Modellselektion, Parameterschätzung und Prognose orientieren sich jedoch durchgehend am klassischen Box-Jenkins-Ansatz und sind daher so kaum einsetzbar. Insbesondere die rasche Anpassung an Niveauveränderungen, das häufige Vorliegen kurzer Zeitreihen, fehlende Werte und Ausreißer lassen den Einsatz dynamischer linearer Modelle ratsam erscheinen. In diesen Modellen wird zwischen der Beobachtungsgleichung für die beobachteten Werte und der Evolutionsgleichung (Systemgleichung, Zustandsgleichung) für die Regressionskoeffizienten unterschieden. Diese kann sich zeitlich verändern und ermöglicht damit eine schnelle Anpassung an Richtungs- bzw. Niveauänderungen. Von zentraler Bedeutung sind bei diesem Ansatz Annahmen über die möglicherweise zeitlich variierende Varianz des Beobachtungsfehlers bzw. die Kovarianzmatrix der Fehler. Zur automatischen Disposition werden die dynamischen linearen Modelle bis dato nicht eingesetzt. Im Übrigen beruhen alle praktisch angewendeten Prognosen auf der symmetrischen Minimierung von Prognosefehlern (Mean Squared Error, Mean Absolut Deviation etc.), was in der Praxis keinen Sinn macht, da zu hohe Prognosen mit anderen Kosten verbunden sind als zu niedrige Prognosen. Kooperation Bergische Universität – Gesamthochschule Wuppertal; Prof. Dr. Gerhard Arminger Förderung 65 03 002; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2000 Publikationen Götz, N. (1999), Automatische Dispositionssyteme für den Handel, Eul-Verlag, Lohmar, Köln. 5.11.8 SFB 475, Teilprojekt B3: Multivariate Bestimmung und Untersuchung von KonjunkturzyklenLeitung Prof. Dr. Weihs, C.; Prof. Dr. Heilemann, U. Mitarbeit Dipl.-Stat. Garczarek, U.; Dipl._Math. Münch, H.- J. Beschreibung Diagnose und Prognose konjunktureller Entwicklungen zählen zu den klassischen Schwerpunkten der ökonomischen und ökonometrischen Forschung. In den letzten Jahren gewinnt neben dem traditionellen Interesse an der Formulierung und Überprüfung quantitativer Aussagen auch das Interesse an qualitativen Aussagen (Aufschwung, Wendepunkt usw.), d. h. an der Kodifizierung diskreter Zustände zunehmend an Bedeutung. Für uns stehen dabei zwei Fragen im Vordergrund: Erstens, wie lässt sich möglichst gut aus quantitativen Teilinformationen eine Gesamtaussage über die diskreten Zustände gewinnen; zweitens, lassen sich wie auch immer gewonnene Gesamtaussagen zu einer (überlegenen) Kombinationsaussage weiter verdichten. Wesentliche Voraussetzung zur Bearbeitung beider Fragen sind Kriterien zur Beurteilung qualitativer/diskreter Aussagen. Die Modellierung der Konjunkturzyklen stützt sich auf "stilisierte Fakten", die mithilfe von Cluster- bzw. Klassifikationsverfahren nach unterschiedlichen Kriterien gewonnen wurden. Dabei geht es einerseits um eine möglichst gut fundierte, datengestützte Identifikation unterschiedlicher Konjunkturzustände, andererseits um "Komplexitätsreduktion" in Gestalt einer möglichst einfachen Charakterisierung der identifizierten Zustände mit dem Ziel einer robusten Zuordnung innerhalb, vor allem aber außerhalb des Testzeitraums "Prognose"). Ein besonders wichtiges und angesichts bislang weitgehend fehlender a priori Klassifizierungen empirisch interessantes Untersuchungsobjekt ist in diesem Zusammenhang der Euro-Zyklus ("Euroland"). Klassifikationsergebnisse für Deutschland gaben Hinweise auf einen z. T. erheblichen Wandel der Klassifikationsdeterminanten. Die dabei überwiegend als Gütemaße verwendeten Fehlklassifikationsraten erwiesen sich allerdings als relativ grobes Beurteilungskriterium, so dass nach schärferen bzw. zusätzlichen Maßen gesucht werden muss. Ein bislang kaum verfolgter Ansatz für die Lösung dieses Problems liegt in der Klärung der symptomatischen, vor allem aber der analytischen Frage nach dem "Erklärungsbeitrag" einzelner Variablen (z. B. Lohnstückkosten, Investitionstätigkeit) beziehungsweise Variablengruppen (Realsphäre, Arbeitsmarkt, Preissphäre und so weiter) und dessen möglichen Veränderungen im Zeitablauf. Im Lichte dieses Ansatzes wie der aktuellen Ergebnisse von Prognose-Klassifikationen (Heilemann und Münch, 1998, Schäfer-Jäckel et al., 1999) und der Ergebnisse von Röhl (1998) ist nicht auszuschließen, dass auch der Katalog der klassifizierenden Variablen einer Revision bedarf. Letztendlich wird in Fortführung der Arbeiten der ersten Antragsphase eine konsensfähige multivariate, möglichst umfassende Definition des Konjunkturzyklus für ausgewählte Länder bzw. Ländergruppen angestrebt. Kooperation: Gerhard-Mercator Universität – Gesamthochschule Duisburg, Rheinisch-Westfälisches Institut für Wirtschaftsforschung e.V. (RWI) Essen; Prof. Dr. Ullrich Heilemann Förderung 65 03 003, 65 03 006 ; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Ullrich Heilemann (1999) „Diskriminanzanalyse als Instrument der Konjunkturanalyse“, in: Statistisches Bundesamt (Hrsg.), Konjunkturforschung heute – Theorie, Messung, Empirie. Beiträge zum Kolloquium am 18. und 19. November 1999 in Wiesbaden. Forum der Bundesstatistik 35/36. Stuttgart: Metzler-Poeschel, 117–133. Ullrich Heilemann and Heinz Josef Münch, (1997) Forecast of 1997/3 – 1999/4 Business Cycles by Means of Discrimination, RWI Konjunkturbericht 48, Heft 2, 146-148 Ullrich Heilemann und Heinz Josef Münch, (2001) “Ifo Data and the German Cycle – Results of Multivariate Discriminant Analysis 1961-1997“, Ifo Studien 47, 41-63. Ullrich Heilemann und Heinz Josef Münch, (1999) "Classification of West German Business Cycles 1955 – 1994," Jahrbücher für Nationalökonomie und Statistik, 219, 632-656 Michael C. Röhl (1998) Computerintensive Dimensionsreduktion in der Klassifikation, Josef Eul Verlag, Lohmar. Claus Weihs und Ullrich Heilemann (2000), "Diskriminanzanalyse", in: Taschenbuch der Statistik, W. Voß (ed.), Fachbuchverlag Leipzig, 583 – 608. 5.11.9 SFB 475, Teilprojekt B4: Strategien zur optimalen Kombination von WirtschaftsprognosenLeitung Prof. Dr. Trenkler, G. Mitarbeit Dr. Wenzel, T.; Dipl.-Math. Troschke, S.-O. Beschreibung Das Ziel dieses Teilprojekts liegt in der praxisorientierten Kombination von Vorhersagen für ökonomische Variablen. Dabei werden die Informationen aus den individuellen Prognosen mit dem Ziel gebündelt, eine verbesserte (kombinierte) Prognose zu erhalten. Es ist zu untersuchen, ob und wie konventionelle Verfahren zur Kombination von Vorhersagen modifiziert werden können, damit die Kombinationsprognose trotz verletzter Annahmen (wie etwa Kenntnis der Kovarianzstruktur) noch einen Gewinn gegenüber den herkömmlichen, manchmal sehr einfachen Standard-Kombinationsverfahren bietet. Ferner sollen zusätzliche Aspekte (zum Beispiel Zusatzinformationen in Form von Expertenwissen, Auftreten von extremen Prognosen (Ausreißer)) für die Kombinationsprognose berücksichtigt werden. Für bestimmte Fragestellungen ist es sogar notwendig, neue Ansätze zur Prognosekombination zu entwickeln, wenn es etwa darum geht, verzerrte Prognosen oder Prognosen für diskrete Variablen zu kombinieren. Als Grundlage für die Kombination diskreter Prognosen sollen geeignete Bewertungskriterien identifiziert und analysiert werden. Hier, wie auch im stetigen Fall, sollen insbesondere Gütekriterien untersucht werden, die auf asymmetrischen Verlustfunktionen beruhen. Zur Lösung dieser Probleme und Fragestellungen werden, soweit möglich, theoretisch bereits bekannte Verfahren auf die Erstellung von Kombinationsprognosen übertragen, oder es werden neue Verfahren hierfür entwickelt. Lassen sich neu entwickelte Verfahren auf theoretischer Basis nicht hinreichend gut mit bereits bekannten Verfahren vergleichen, so wird dieser Vergleich anhand von Simulationsstudien und konkreten Datensätzen aus der Praxis erfolgen. Förderung 65 03 004; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Klapper, M. (2000). The Combination of Forecasts Using Rank-Based Techniques; with Applications to Macro Economic, Sales, and Temperature Forecasts. Josef Eul Verlag, Lohmar. Dissertation. Wenzel, T. (2001). Die Kombination von Prognosen unter Berücksichtigung statistischer Bewertungkriterien. Josef Eul Verlag, Lohmar. Dissertation. Trenkler, G. (1999). A remark on prediction problems in regression analysis. Journal of Statistical Research, 33, 67-70. Groß, J. (1998). Statistical estimation by a linear combination of two given statistics. Statistics & Probability Letters, 39, 379–384. Klapper, M. (1999). Combining German macro economic forecast data using rank-based techniques. American Statistical Association, Proceedings of the Business and Economic Statistics Section, 197-202. Schmidt, K. und Trenkler, G. (1998). On the performance of the L1-estimator in linear regression. In: Proceedings in Computational Statistics 1998, A. Payne und P. Lane (Hrsg). I.A.C.R. Rothamsted, Harpenden, 117-118. Schneider, C., Klapper, M. und Wenzel, T. (1999). An Evaluation of Forecasting Methods and Forecast Combination Methods in Goods Management Systems. Sonderforschungsbereich 475, Universität Dortmund. Technical Report 31/1999. 5.11.10 SFB 475, Teilprojekt C1: Entwicklung statistischer Methoden zur Analyse molekulargenetischer und toxikokinetischer DatenLeitung Prof. Dr. Urfer, W.; Prof. Dr. Dr. Bolt, H. Mitarbeit Dipl.-Stat. Brunnert, M.; Dipl.-Stat. Kötting, J.; Dr. Selinski, S.; PD Dr. Golka, K. (IfADo) Beschreibung Durch die Weiterentwicklung von Analysemethoden und neuen Erkenntnissen auf dem Gebiet der Molekulargenetik fallen zunehmend Daten mit Strukturen an, die neue Herausforderungen an die Statistiker stellen. Besonders auf dem Gebiet der Toxikokinetik und der genetischen Epidemiologie besteht ein besonderer Bedarf an neuen Auswertestrategien, die statistischen Erfordernissen gerecht werden. Dazu wurden im zurückliegenden Förderzeitraum Methoden zur Analyse von toxikokinetischen Daten mittels Populationsmodellen unter Verwendung des EM-Algorithmus entwickelt. Weiterführendes Ziel dieses Projektes ist es am Beispiel der Toxikokinetik von Ethylen entwickelte Populationsmodelle und den EM-Algorithmus für neue toxikokinetische Daten aus dem Bereich endokrin wirksamer Chemikalien weiterzuentwickeln. Dabei sollen zur Verbesserung der Risikoabschätzung für den Menschen aus tierexperimentellen Daten Markov-Chain-Monte-Carlo-Algorithmen unter Verwendung von PBPK-Modellen (Physiologically-Based Pharmacokinetic) eingesetzt werden. Der zweite Schwerpunkt der zurückliegenden Projektarbeit lag in der Entwicklung flexibler Regressionsverfahren bei der Untersuchung von modifizierten Hill-Kinetiken zur Beschreibung der Interaktion von Dioxin mit dem Ah-Rezeptor und der Analyse von kompetitiven Hemm-Experimenten. Zudem gelang die Verknüpfung des TBS-Ansatzes mit Modellen mit zufälligen Effekten. Für die Zukunft soll eine Verbesserung der Standardfehlerschätzung geschätzter kinetischer Parameter mittels Bootstrap-Simulationen erreicht werden. Die Güte der Approximation bei der Komplexitätsreduktion biochemischer Prozesse soll mittels Simulationsstudien überprüft werden. Zusammen mit der Arbeitsgruppe Tumorgenetik des Max-Planck-Instituts für molekulare Physiologie in Dortmund sollen stochastische Modelle für die Polymerase-Ketten-Reaktion entwickelt werden. Daten mit komplexen Abhängigkeitsstrukturen, die auf binärem und ordinalem Messniveau vorliegen, konnten schon bei der Analyse von Wald-Ökosystemen unter Berücksichtigung räumlicher und zeitlicher Korrelationen untersucht werden. Diese Erfahrungen sollen bei genetisch epidemiologischen Fragestellungen eingebracht werden. Ein Ziel in der genetischen Epidemiologie ist es hier, eine in sich geschlossene Methodik zu entwickeln, die es ermöglicht, Tumorhäufigkeit, Überlebenszeiten von Krebspatienten und Verweildauern in einem gesunden Zustand in Abhängigkeit von Risikofaktoren, Tumor-Suppressor-Genen und der genetischen Vorgeschichte zu modellieren. Dass Probanden nicht zufällig ausgewählt werden, soll dabei schon in der Modellbildung mit berücksichtigt und korrigiert werden können. Dispositionsmodelle und Neuronale Netze bilden einen ersten Ansatzpunkt. Hierbei soll ein allgemein zugängliches Software-Paket entwickelt werden. Für die geplanten statistischen Untersuchungen und Auswertungen liegen u. a. experimentelle Daten zur Toxikokinetik der endokrin aktiven Stoffe p-tert-Octylpenol, Bisphenol A und Daidzein am IfADo (Institut für Arbeitsphysiologie an der Universität Dortmund) vor. Das DKFZ (Deutsche Krebsforschungszentrum) in Heidelberg kann darüber hinaus Rezeptor-Bindungs-Daten mit wiederholten Experimenten zur Verfügung stellen. Weichgewebe-Tumor-Daten über Stammbäume liegen vom M.D. Anderson Cancer Centre (Houston, USA) vor. Familien-Datensätze zur Brustkrebs- bzw. Prostata-Tumor-Analyse sind vom Center for Human Genome Research (Washington, USA) bzw. weiteren medizinischen Instituten der USA zur Verfügung gestellt worden. Kooperation Prof. Dr. Dr. Hermann Bolt, Institut für Arbeitsphysiologie an der Universität Dortmund Förderung 65 04 001; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Frei, E., Gilberg, F., Schröder, M., Breuer, A., Edler, L. und Wiessler, M. (1999), "Analysis of the inhibition of N-nitroso-dimethylamine activation in the liver by N-nitro-dimethyl-amine using a new nonlinear statistical method", Carcinogenesis, 20, 459-464. Gilberg, F., Edler, L. und Urfer, W. (1999), "Heteroskedastic Nonlinear Regression Models with Random Effects and their Application to Enzyme Kinetic Data", Biometrical Journal, 41, 543-557. Golka, K., Bandel, T., Reich, S., Urfer, W. und Bolt, H.M. (1998), "Urothelial cancer of the bladder in an area of former coal, iron and steal industries in Germany - a case control study", International Journal of Occupational and Environmental Health, 4, 79-84. Golka, K., Bandel, T., Reckwitz, T., Kempkes, M., Blaszkewicz, M., Urfer, W., Soekeland, J., Schulze, H. und Bolt, H.M. (1998), "Elevated bladder cancer risk in underground coal miners in the Ruhr area: epidemiological and toxicogenetic data", Occupational Hygiene, 4, 443-453. Golka, K., Becka, M., Bolt, H.M., Urfer, W. (1999), "Statistical aspects of toxicokinetics in dynamic systems: an inhalation study of propylene in rats", Central Europ. J. Occup. Environ. Med., 5, 181-191. Golka, K., Bandel, T., Reckwitz, T., Urfer, W., Bolt, H.M., Bremicker, K.D., Neugebauer, W. und Schulze, H. (1999), "Berufliche Risikofaktoren des Harnblasenkarzinoms - eine Fall-Kontroll-Studie", Urologe A, 38, 358-363. Neuhäuser, M., Seidel, D., Holthorn, L.A. und Urfer, W. (2000), "Robust trend tests with application to toxicology", Environmental and Ecological Statistics, 7, 43-56. Selinski, S., Golka, K., Bolt, H.M., Urfer, W. (2000), "Estimation of Toxicokinetic Parameters in Population Models for Inhalation Studies with Ethylene", Environmetrics, 11, 479 – 495. Thier, R., Lewalter, J., Kempkes, M., Selinski, S., Brüning, T. und Bolt, H.M. (1999), "Haemoglobin adducts of acrylonitrile and ethylene oxide in acrylonitrile workers, dependent on polymorphismus of the glutathione S-transferases GSTT1 and GSTM1", Arch. Toxicol., 73, 197-202. Urfer, W. (1998), "Genotoxizität - Auswertung von Mutagenitätsstudien", in: Verfahrensbibliothek: Versuchsplanung und -auswertung, Bd. II, D. Rasch, G. Herrendörfer, J. Bock, N. Viktor, und V. Guiard (Hrsg.), 611-616. 5.11.11 SFB 475, Teilprojekt C2: Statistische Analyse von räumlich und zeitlich variierenden Daten in Medizin und ÖkologieLeitung Prof. Dr. Urfer, Wolfgang; Prof. Dr. Schach, S. Mitarbeit Dipl.-Stat. Krahnke, T.; Dipl.-Stat. Berke, O.; Dipl.-Stat. Kötting, J.; Dr. Scheffner, A.; Dipl.-Stat. Gerß, J.; Dipl.-Stat. Theek, C. Beschreibung In diesem Teilprojekt sollen statistische Methoden zur Analyse von räumlich und zeitlich variierenden Daten entwickelt werden. Die Analyse zeitlich-räumlicher Daten mit statistischen Mitteln ist hierbei vergleichsweise neu. Aufgrund der erforderlichen Rechner-Ressourcen war sie bisher kaum handhabbar. Mit den Veränderungen im Bereich der Computer-Hardware rückt diese Schwierigkeit jedoch immer mehr in den Hintergrund. Bisherige Ansätze beschränkten sich jedoch hauptsächlich darauf, derartige Prozesse entweder als rein räumliche bzw. an einer festen Stelle als rein zeitliche Phänomene aufzufassen. Da sich jedoch viele Phänomene gleichzeitig in Zeit und Raum ausbreiten oder verändern, besteht hier noch großer Bedarf an der Entwicklung entsprechender statistischer Methoden. Im Teilprojekt C2 sollen daher Ansätze und Vorschläge erarbeitet werden, die die besondere dynamische Struktur zeitlich-räumlicher Daten berücksichtigen. Um ein Verharren im Bereich allgemeiner Modelle zu vermeiden, sollen Modellansätze für konkrete medizinische und ökologische Prozesse unter Einbeziehung von verfügbaren Datenkörpern untersucht werden. Die Ansätze zur Analyse zeitlich-räumlicher Daten sind in ihrer praktischen Anwendung auf unterschiedliche Weise auf die zur Verfügung stehenden Daten sowie die jeweils zugrunde liegende Fragestellung anzupassen. So macht es einen Unterschied, ob stetige oder kategorielle Daten untersucht werden, oder ob im Ergebnis eine Prognose, Prädiktion oder eine beschreibende Zusammenfassung der typischen Charakteristika der Daten erwartet wird. Aus diesem Grund werden die in Teilprojekt C2 behandelten Themenbereiche in mehrere Gruppen unterteilt. Diese sind: A. Zeitlich-räumliche Modelle bei kategoriellen Daten. B. Prädiktion stetiger Messwerte in Raum und Zeit. C. Modellierung der Raum-Zeit-Dynamik bei stetigen Daten. Ein erster Ansatzpunkt für die zeitlich-räumlichen Modelle bei kategoriellen Daten in der epidemiologischen und ökologischen Forschung zur Untersuchung von Einflussfaktoren ist durch das lineare logistische Modell gegeben. McCullagh stellt mit dem Proportional-Odds-Modell (POM) eine Verallgemeinerung dieses Modells für ordinale Zielvariablen vor. Bei zugrunde liegender stetiger, nicht beobachtbarer Zufallsvariable kann durch das Konzept der Schwellenwertmodelle die dem POM unterstellte logistische Verteilungsfunktion durch andere Verteilungsannahmen ersetzt werden. So ist eine Basis zur Berücksichtigung eines binären oder ordinalen Messniveaus gegeben. Zur Analyse longitudinaler Datenstrukturen können Vorschläge von Stram et al. (Marginal-Modellbildung), sowie Bonney und Ware et al. (Übergangsmodellbildung) verwendet werden. Marginal-Modelle ermöglichen dabei eine Analyse der von Kovariablen abhängigen Wahrscheinlichkeitsverteilungen über die Zeit. Der Schwerpunkt bei den Übergangsmodellen wird auf die individuellen Veränderungen gelegt. Räumliche Datenstrukturen werden bei kategoriellen Daten bisher hauptsächlich durch Verwendung des GEE-Ansatzes von Liang und Zeger oder durch Nachbarschaftseffekten modelliert. Zeitlich-räumliche Modelle sollen hier anhand eines Waldschadensdatensatzes, der von der Forschungsanstalt Wald, Schnee und Landschaft (WSL), Birmensdorf, Schweiz zur Verfügung gestellt wurde, entwickelt werden. Zur Prädiktion stetiger Messwerte in Raum und Zeit unterscheidet man zwischen geostatistischen Daten und Regionaldaten. Geostatistische Daten sind räumlich verteilte Daten mit kontinuierlich variierendem räumlichen Index bzw. Bezugspunkt. Optimale räumliche Prädiktionsmethoden für geostatistische Daten sind als Kriging bekannt. Optimale Prädiktionsmethoden für Zeitreihen sind mittels des Kalman Filters möglich. Optimale Prädiktionsmethoden für sequentielle geostatistische Stichproben sind in der Entwicklung. Viel versprechende Ansätze in diese Richtung wurden u.a. von Thiébeaux, Gründer, Goodall und Mardia, Huang und Cressie und Berke vorgeschlagen. Standardmethoden haben sich jedoch nicht herauskristallisiert. Regionaldaten sind räumliche Daten mit diskretem räumlichen Index, die auch unter dem Namen Gitterdaten behandelt werden. Für sequentielle Stichproben regionaler Daten bzw. raumzeitliche Regionaldaten existieren ebenfalls keine Standard-Prädiktionsmethoden. Vorschläge in dieser Richtung stammen u.a. von Stoffer. Förderung 65 04 002; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2000 Publikationen Berke, O. (1998a), "On spatiotemporal prediction for online monitoring data," Communications in Statistics - Theory and Methods, 29, 2343-2369. Berke, O. (1999), "Estimation and prediction in the spatial linear model," Water, Air and Soil Pollution, 110, 215-237. Bourgeouis, P., Meier, A. und Urfer, W. (1997), "Data storing and statistical analysis of the results of the PEF-research-teams from the open-top-chamber experiment at Edelmannshof," in: Air pollutant exclusion experiment with spruce trees at Edelmannshof. Physiological and biochemical investigations, Forschungszentrum Karlsruhe, Projekt Europäisches Forschungszentrum für Maßnahmen zur Luftreinhaltung, 164, 261-278. Márkus, L., Berke, O., Urfer, W., and Kovács, J. (1999), "Spatial Prediction of the Intensity of Latent Effects Governing Hydrogeological Phenomena," Environmetrics 10, 633-654. Schmitz, N. und Urfer, W. (1997), "State-dependent time series models for heart rate dynamics data and their application to psychophysiology," Informatik, Biometrie und Epidemiologie in Medizin und Biologie, 28, 169-184. Urfer, W. und Berke, O. (1997), "Applications of geostatistics in monitoring systems and forest ecosystem research," Sociedade Portuguesa de Estatistica, Boletim Informativo, 16-20.
5.11.12 SFB 475, Teilprojekt C3: Meta-analytische Methoden für biometrische und epidemiologische StudienLeitung Prof. Dr. Hartung, J. Mitarbeit Dipl. Stat. Argaç, D.; Dr. Böckenhoff, A.; Dr. Knapp, G. Beschreibung Meta-Analyse als wirkungsvolles Instrumentarium zur Kombination von Informationen aus verschiedenen Quellen hat sich in den vergangenen Jahren als eigenständige statistische Disziplin immer mehr in den verschiedenen Anwendungsgebieten der Statistik etabliert. Natürlich resultiert daraus auch eine Offenlegung der Schwächen der Meta-Analyse bzw. es eröffnen sich neue Probleme, die eine genaue und gewissenhafte Analyse dieser Thematik erfordern. Es haben sich einige Schwerpunkte in der Forschung zur Meta-Analyse in den letzten Jahren herauskristallisiert, die nun angegangen werden sollen. Trotz der langen Historie steht die Kombination von p-Werten immer noch im Fokus der Forschung. Ihre Bedeutung und Berechtigung haben die Methoden zur Kombination von p-Werten letztlich in der Tatsache, dass in vielen Experimenten oft nur die "nackten" p-Werte bzw. Realisierungen der Teststatistiken berichtet werden und keine Möglichkeit mehr besteht, weitere Informationen zu den jeweiligen Experimenten zu erhalten. Hier soll nun versucht werden, Schwächen und Widersprüche einiger etablierter Verfahren zur Kombination von p-Werten, die in der letzten Zeit in der Literatur dargelegt wurden, aufzugreifen und diese Defekte zu eliminieren. Des Weiteren soll eine Standardannahme, nämlich die Unabhängigkeit der p-Werte, fallen gelassen und eine Korrelation zugelassen werden, um anschließend korrelierte p-Werte zu kombinieren. In der aktuellen Diskussion zur Meta-Analyse steht auch das Phänomen des "borrowing of strength" weiterhin im Vordergrund. Hier soll nun versucht werden, Techniken der Varianzanalyse, die bisher in der Meta-Analyse weitgehend ignoriert werden, in diesen Themenkreis einzubringen. Es bleibt noch anzumerken, dass "borrowing of strength" gemeinhin als Schätzproblem, jedoch nicht als Testproblem aufgefasst wird, und deshalb ist es erforderlich, "borrowing of strength" auch im Kontext des Testens anzugehen, weil in vielen Studien eine Entscheidung über die Wirksamkeit einer Behandlung eine zentrale Rolle spielt. In praxi wird in den durchgeführten Studien nur selten eine einzelne Zielgröße erhoben. Um diese Information vollständig auszuschöpfen, ist es daher nötig, dem multivariaten Charakter der erhobenen Datensätze Rechnung zu tragen, und bei einer meta-analytischen Zusammenfassung die multivariate Struktur, insbesondere die Abhängigkeiten der verschiedenen Zielgrößen, zu berücksichtigen. Die Frage der Homogenität bzw. Heterogenität ist weiterhin ein noch nicht zufrieden stellend gelöstes Problem, obwohl in vielen Publikationen die Prüfung auf Homogenität als erster wichtiger Schritt in jeder Meta-Analyse angesehen wird. Insbesondere sind es hier neue Tests auf Homogenität, die entwickelt und untersucht werden sollen. Wird eine Homogenität zwischen den Studien mittels eines Tests negiert, so besteht eine Möglichkeit, die Heterogenität zwischen den Studien durch Einbeziehung studienspezifischer Einflussgrößen zu erklären. Die Entwicklung solcher Modelle steckt größtenteils noch in der Anfangsphase. Während die oben angesprochenen Themenkreise sich mit der geschickten Kombination von aggregierten Größen einzelner Experimente oder Studien befassen, ist die Meta-Analyse von Originaldaten, falls diese verfügbar sind, kein Routineverfahren der Praxis, weil die Zeit- und Kostenfrage hier eine entscheidende Rolle spielt und die Durchführung von Meta-Analysen mit Originaldaten nur selten erlaubt. Nichtsdestotrotz sind hier Anstrengungen unternommen worden, Originaldaten zu publizieren. Es ist nun die Aufgabe, entsprechende Methoden der Meta-Analyse von Originaldaten vorzuschlagen und diese mit Meta-Analysen komprimierter Daten zu vergleichen. Sich diesen vielfältigen, oben geschilderten Herausforderungen zu stellen, neue eigene Lösungsvorschläge einzubringen bzw. geeignete Modifikationen bestehender Methoden zu erarbeiten, diese dann zu analysieren und neue Problemkreise zu entdecken resp. anzusprechen, ist das vorrangige Ziel des Projekts. Förderung 65 04 003; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 5.11.13 SFB 475, Teilprojekt C4: Zeitreihenanalytische Methoden zur Behandlung von Online-Monitoring-Daten aus der IntensivmedizinLeitung Prof. Dr. Gather, U.; Dr. med. Imhoff, M. (Klinikum Dortmund); Prof. Dr. Morik, K. Mitarbeit Dr. Fried, R.; Dipl.-Stat., Lanius, V. Beschreibung Ziel dieses Teilprojekts ist die Entwicklung intelligenter Alarm- und Analysesysteme zur bettseitigen Kontrolle des Patientenzustandes. Die Grundlage hierfür liefert weiterhin die automatische Online-Erfassung von über 2000 Variablen (Vitalparameter, Laborwerte, Medikamentengaben, therapeutische Maßnahmen, etc.) mit Hilfe eines klinischen Informationssystems, das auf der Chirurgischen Intensivstation der Städtischen Kliniken Dortmund betrieben wird. Die zu entwickelnden statistischen Methoden sind im Bereich der multivariaten Zeitreihenanalyse sowie der multivariaten Prozesskontrolle angesiedelt. Angesichts der hohen Dimension der intensivmedizinischen Online-Daten besteht dabei zunächst ein erheblicher Forschungsbedarf auf dem Gebiet der Dimensionsreduktion multivariater Zeitreihen. Zur Lösung dieser Problematik sollen Ansätze aus der Hauptkomponentenanalyse für Zeitreihen, aus den graphischen Modellen und aus Sliced-Inverse-Regression-Techniken auf den Zeitreihenkontext weiter adaptiert bzw. neu zugeschnitten und echtzeitfähig gemacht werden. Nach erfolgter Dimensionsreduktion bleibt die Aufgabe der (immer noch multivariaten) Prozesskontrolle. Diese soll bewältigt werden durch die Konstruktion von neuen Kontrollkarten für multivariate zeitabhängige Daten auf der Basis exponentiellen Glättens. Insgesamt sind online-fähige statistische Verfahren zu erarbeiten, die nicht nur Aussagen über mögliche Zustandsänderungen im Sinne reiner Change-Point-Erkennung erlauben, sondern auch qualitative und quantitative Feststellungen über die Art und die Stabilität des Patientenzustandes treffen können. Durch die enge Zusammenarbeit der Teilprojekte C4 und A4 bereits zu Beginn der ersten Bewilligungsphase entstanden Synergien, die u. a. zu einem ersten Verfahren zur Prognose des Arztverhaltens führten. Diese Zusammenarbeit wird intensiviert durch die Erweiterung des Teilprojekts C4 durch einen Bereich, in dem die Schnittstelle von Methoden der künstlichen Intelligenz und der Statistik zur Analyse von intensivmedizinischen Daten angesiedelt ist. Insbesondere Techniken der wissensbasierten Modellierung und des maschinellen Lernens liefern Methoden zur Generierung medizinischen Wissens, zu dessen operationaler Formulierung in Wissensbasen und zu dessen Abgleich mit Patientendaten. Durch die Verknüpfung derartiger Verfahren der künstlichen Intelligenz mit den oben genannten statistischen Methoden sollen so Hybridverfahren entstehen. Mit deren Hilfe werden dann operationale Protokolle erstellt, die als Entscheidungshilfen für den behandelnden Arzt dienen können. Langfristig angestrebt ist die Implementierung der entwickelten Verfahren in medizinische Informationssysteme, die in der Praxis zur Anwendung kommen sollen. Kooperation Informatik (Prof. Dr. Katharina Morik, Lehrstuhl Informatik VIII); Chirurgische Klinik, Klinikum Dortmund (Dr. med. Michael Imhoff) Förderung 65 04 004; DFG Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003 Publikationen Bauer, M., Gather, U. und Imhoff, M. (1998), "Analysis of high dimensional data from intensive care medicine", in: Proceedings in Computational Statistics, R. Payne, P. Green (eds.), Physica-Verlag, Heidelberg, 185-190. Bauer, M., Gather, U., Imhoff, M. (1999) The identification of multiple outliers in online monitoring data, Technical Report 29/1999, SFB 475, eingereicht. Becker, C., Fried, R. und Gather, U. (2001) "Applying Sliced Inverse Regression to Dynamical Data", in: J. Kunert, G. Trenkler (eds.) Mathematical Statistics with Applications in Biometry, Josef Eul, Lohmar, 201-204. Gather, U., Fried, R., Lanius, M., Imhoff, M. (2001) Online monitoring of high Dimensional physiological time series - a case-study, Estadistica, im Druck. Imhoff, M., Bauer, M. und Gather, U. (1999), "Time-Effect Relations of Medical Interventions in a Clinical Information System", in: KI-99: Advances in Artificial Intelligence, W. Brugard, T. Christaller, A. Cremers (eds.), Lecture Notes in Artificial Intelligence 1701, Springer, Berlin, 307-310. Imhoff, M., Bauer, M., Gather, U. und Löhlein, D. (1997), "Time series analysis in intensive care medicine", Applied Cardiopulmonary Pathophysiology, 6, 263-281. Imhoff, M., Bauer, M., Gather, U. und Löhlein, D. (1998), "Statistical pattern detection in univariate time series of intensive care on-line monitoring data", Intensive Care Medicine, 24, 1305-1314. Imhoff, M., Gather, U. und Morik, K. (1999), "Development of Decision Support Algorithms for Intensive Care Medicine: A New Approach Combining Time Series Analysis and a Knowledge Base System with Learning and Revision Capabilities", in: KI-99: Advances in Artificial Intelligence, W. Brugard, T. Christaller, A. Cremers, (eds.), Lecture Notes in Artificial Intelligence 1701, Springer, Berlin, 219-230. Morik, K., Brockhausen, P. und Joachims, T. (1999), "Combining statistical learning with a knowledge-based approach - A case study in intensive care monitoring", in: Proc. 16th Int'l Conf. on Machine Learning (ICML-99), Morgan-Kaufman, San Francisco, 268-277. Morik, K., Imhoff, M., Brockhausen, P., Joachims, T. und Gather, U. (2001) "Knowledge Discovery and Knowledge Validation in Intensive Care", In: Artificial Intelligence in Medicine, Vol. 19, S. 225 – 249. 5.11.14 SFB 475, Teilprojekt C5: Analyse und Modellbildung des Tiefbohrprozesses mit Methoden der Statistik und Neuronalen NetzenLeitung Prof. Dr. Weihs, C.; Prof. Dr.-Ing. Dr. h.c. Weinert, K.; Prof. Dr.-Ing. von Seelen, W. Mitarbeit Dipl.-Stat. Busse, A. M.; Dipl.-Ing. Webber, O.; Dipl.-Inform. Mehnen, J. Beschreibung Das spezielle Verfahren des BTA-Tiefbohrens (Boring and Trepanning Association) wurde entwickelt, um lange Bohrungen herstellen zu können. Auf Grund der sehr geringen Steifigkeiten der dort eingesetzten schlanken Werkzeuge ergeben sich Probleme wie Rattern, Abweichungen im Mittenverlauf und Wellenbildung. Derartige Oberflächen- und Formfehler stellen eine erhebliche Schädigung des Werkstücks dar. Diese Prozessstörungen folgen einer noch weitgehend unbekannten Systemdynamik und sind daher schwer vorhersagbar. Im Rahmen des Projekts sollen als Basis für eine analytische Beschreibung der Systemdynamik des BTA-Tiefbohrens on-line Zeitreihen aus dem laufenden Prozess aufgenommen werden, insbesondere von den wirkenden Kräften und Momenten, von Werkzeugbewegungen sowie von Körperschallsignalen. Off-line gemessene Parameter wie Rauheit, Welligkeit und Rundheit sowie Oberflächenschriebe bilden die Basis für eine quantitative Charakterisierung der Bohrgüte. Um den Tiefbohrprozess besser verstehen und damit kontrollieren zu können, sollen Modelle sowohl aus der Statistik als auch aus der Neuroinformatik abgeleitet werden, die das Verfahren charakterisieren. Hierzu gehören (1) Modelle zur Prognose der Ergebnisgüte (Rauheit, Schwingungstyp) aus den Fertigungsparametern (z. B. Maschinen- und Werkstoffparameter), (2) Modelle zur Ableitung von charakteristischen Kenngrößen aus den gemessenen Zeitreihen, (3) Modelle zur Prognose dieser Kenngrößen aus den Fertigungsparametern und (4) Modelle zur Prognose der Ergebnisgüte aus den Kenngrößen. Die wichtigsten Ziele des Projekts sind: Der Aufbau eines Messsystems zur Aufnahme von Zeitreihen aus dem Tiefbohrprozess dient als Ausgangspunkt für eine statistische und neuroinformatische Analyse, die zu tieferem Verständnis der Prozessdynamik führt. Die technologisch orientierte Interpretation bildet die Basis für die praktische Umsetzung der Erkenntnisse aus der Theorie. Eng damit verbunden ist die Entwicklung statistischer Versuchspläne zur Erfassung der Prozessdynamik. Die damit einhergehende statistische Modellierung des gesamten technischen Prozesses hat das Ziel, sich ändernde Randbedingungen möglichst realistisch und flexibel abzubilden. Von der Einbindung neuronaler Netze werden Innovationen in der Modellierung durch einen neuartigen Typ von Modellen erwartet. Für die Neuroinformatik ergibt sich aus der dynamischen Natur des Produktionsprozesses der Ansatz, die Analyse des Tiefbohrens mit dynamikfähigen Modellen anzugehen und die entsprechenden Verfahren dahingehend zu modifizieren. Gesamtziel ist die Erstellung optimaler Prognosen der Ergebnisgüte zur Identifikation von Prozessstörungsursachen und zur optimalen Wahl der Fertigungsparameter und somit zur Gewährleistung schneller und sicherer Fertigung mit hoher Qualität. Kooperation Maschinenbau (Prof. Dr.-Ing. Dr. h.c. Klaus Weinert, Institut für spanende Fertigung); Ruhr-Universität Bochum, Institut für Neuroinformatik (Prof. Dr.-Ing. Werner von Seelen) Förderung 65 04 007, 65 04 008, 65 04 009; DFG Sonderforschungsbereich Laufzeit 01.07.2000 - 30.06.2003 Publikationen K. Weinert, J. Mehnen, O. Webber, A. Busse, M. Hüsken, P. Stagge: Koordinierter Einsatz von Sensorik und Statistik; Zur Analyse und Modellierung von BTA-Tiefbohrprozessen, ZWF, Hanser Verlag, 262-265, 96. Jahrgang, 5/2001. K. Weinert, J. Mehnen, O. Webber, A. Busse, M. Hüsken, P. Stagge: Experimental Investigation of the Dynamics of the BTA Deep Hole Drilling Process, WGP (Hrsg.), Production Engineering-Research and Development in Germany (erscheint in 2001). 5.11.15 SFB 475, Teilprojekt C6: Methoden der statistischen Versuchsplanung zur Analyse und Optimierung von komplexen Umformprozessen am Beispiel des CNC-gesteuerten DrückensLeitung Prof. Dr.-Ing. Kleiner, M.; Prof. Dr. Kunert, J. Mitarbeit Dipl.-Stat. Erdbrügge, M.; Dipl.-Ing. Göbel, R.; Dr.-Ing. Homberg, W.; Dr.-Ing. Maevus, F. Beschreibung Umformprozesse sind gekennzeichnet durch höchst komplexe Zusammenhänge und Wechselwirkungen zwischen einer Vielzahl von Parametern (Einfluss- und Störgrößen), die das Umformergebnis - das ebenfalls durch mehrere Größen (Qualitätsmerkmale) charakterisiert wird - in unterschiedlichster Weise beeinflussen. Dies trifft in besonderer Weise auf das Umformverfahren Drücken zu, wo es für die Beschreibung dieser Zusammenhänge keine (bekannten) funktionellen Beziehungen gibt. Deshalb erfolgt die Prozess- und Werkzeugauslegung beim Drücken bisher ausschließlich auf der Basis von Erfahrungswissen durch Trial-and-Error-Versuche. Diese Vorgehensweise ist sehr aufwendig, nicht reproduzierbar und führt in der Regel nicht unbedingt zu einem Prozessoptimum. Des Weiteren erfolgt die Optimierung meist auf ein spezifisches Bauteil hin, so dass nicht in jedem Fall eine Verallgemeinerung der Ergebnisse möglich ist. Erschwerend kommt hinzu, dass sich der Umformprozess nicht robust verhält; insbesondere haben die innerhalb eines breiten Toleranzbandes schwankenden Blecheigenschaften einen nicht vorhersagbaren bzw. nicht quantifizierbaren Einfluss auf das Umformergebnis. Die heutigen Rahmenbedingungen verlangen jedoch eine wesentlich größere Flexibilität bezüglich der Produktvielfalt sowie optimierte Prozesse hinsichtlich Qualität und Zuverlässigkeit. Dieses Ziel kann mit den dargestellten herkömmlichen Methoden nicht erreicht werden. Deshalb soll im Rahmen dieses gemeinsamen Teilprojektes eine neue Methodik zur Analyse und Optimierung komplexer Umformprozesse entwickelt werden. Aufgrund der oben dargestellten Problematik sollen hierfür Methoden der statistischen Versuchsplanung eingesetzt werden, die dazu unter Rückkopplung mit der Anwendung weiterentwickelt werden müssen. Dies stellt die Hauptzielsetzung des Teilprojektes für den Bereich der Statistik dar. Für die Umformtechnik steht die Weiterentwicklung der Technologie des Drückens im Vordergrund, um den gestiegenen Anforderungen an Fertigungsprozesse zukünftig besser gerecht werden zu können. Dazu gehört auch die Verschiebung der derzeitigen Verfahrensgrenzen z. B. in Richtung der Fertigung sehr dünnwandiger Bauteile oder von Bauteilen aus schwer umformbaren Werkstoffen. Diese Gesamtzielsetzung soll in mehreren Stufen realisiert werden. Dazu sollen zunächst geeignete Methodiken der statistischen Versuchsplanung bei konkreten Einzelprojekten, d. h. ausgewählten Drückteilen, angewandt werden. Daraus ist im nächsten Schritt die allgemeine Problemstruktur abzuleiten. Diese allgemeine Struktur soll dann zur Erarbeitung einer allgemeinen Lösungsmethode für das Drücken führen. Aus statistischer Sicht dient das Projekt zunächst dem Aufbau empirischen Wissens über die Durchführbarkeit der vorgeschlagenen Methoden und die Güte der mathematischen Modelle. Dies wird zu einer besseren Anpassung der Modelle an die Realität und zu einer Erweiterung der Methoden führen. Das Projekt soll dabei neue Methoden zur Auswertung von Versuchen liefern. Hierbei ist insbesondere die Tatsache von Bedeutung, dass das Umformergebnis durch mehrere Größen beschrieben wird. Man benötigt daher multivariate Verallgemeinerungen bestehender Verfahren. Auch sollen Methoden entwickelt und verbessert werden, wie qualitative Zielgrößen erhoben und ausgewertet werden können. Förderung 65 04 010, 65 04 011; DFG / Sonderforschungsbereich Kooperation Fakultät Maschinenbau, Lehrstuhl für Umformtechnik, Prof. Dr.-Ing. Matthias Kleiner Laufzeit 01.07.2000 – 30.06.2003 Publikationen Finckenstein, E. v., und Dierig, H. (1990), ”CNC Drücken,” Annals of the CIRP 3, 267ff. Finckenstein, E. v., Reil, G. (1993), ”Fuzzy Control Used for CNC-metal-spinning,” Production Engineering Vol. I, Issue 1, Carl Hanser Verlag, München, Wien, New York, 65-68. Finckenstein, E. v., Reil, G. (1995), ”Unscharfe Prozessregelung für das Umformverfahren Drücken,” Blech Rohre Profile, 4, 270ff. Kunert, J. (1997), ”Use of the factor sparsity assumption to get an estimate of variance in industrial experiments with many factors,” Technometrics, 39, 81-90. Kunert, J., und Lehmkuhl, F. (1998), "The generalized b-method in Taguchi experiments," in: Atkinson, A.C., Pronzato, L,. und Wynn, H.P. (eds.), MODA 5 – Advances in Model-Oriented Data Analysis, Physica Verlag, 223-230. Toutenburg, H., Gössl, R., Kunert, J. (1998), Quality Engineering. Eine Einführung in Taguchi-Methoden, Prentice Hall, München. 5.11.16 SFB 475, Teilprojekt Z: Zentrale Verwaltung, Organisation und GeschäftsführungLeitung Prof. Dr. Gather, U. Mitarbeit Dr. Berghoff, S.; Dr. Ziebach, T.; Radtke, N.; Dipl.-Ing. (FH) Langhans, T; Schneider, M. Beschreibung Wesentliche Aufgabe dieses zentralen Verwaltungsprojektes ist die übergreifende Koordination der wissenschaftlichen Aktivitäten der einzelnen Teilprojekte des Sonderforschungsbereichs sowie die Darstellung des SFB nach außen. Förderung 65 01 001; DFG / Sonderforschungsbereich Laufzeit 01.07.1997 - 30.06.2003
|