WO2004015574B1 - Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs - Google Patents

Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs

Info

Publication number
WO2004015574B1
WO2004015574B1 PCT/FR2003/002371 FR0302371W WO2004015574B1 WO 2004015574 B1 WO2004015574 B1 WO 2004015574B1 FR 0302371 W FR0302371 W FR 0302371W WO 2004015574 B1 WO2004015574 B1 WO 2004015574B1
Authority
WO
WIPO (PCT)
Prior art keywords
application
replication
resources
node
continuity
Prior art date
Application number
PCT/FR2003/002371
Other languages
English (en)
Other versions
WO2004015574A3 (fr
WO2004015574A2 (fr
Inventor
Marc Vertes
Laurent Dufour
Francois Richard
Gregory Kurz
Original Assignee
Meiosys
Marc Vertes
Laurent Dufour
Francois Richard
Gregory Kurz
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meiosys, Marc Vertes, Laurent Dufour, Francois Richard, Gregory Kurz filed Critical Meiosys
Priority to CA2493407A priority Critical patent/CA2493407C/fr
Priority to DE60328100T priority patent/DE60328100D1/de
Priority to AU2003273481A priority patent/AU2003273481A1/en
Priority to AT03755641T priority patent/ATE434790T1/de
Priority to EP03755641A priority patent/EP1529259B1/fr
Priority to US10/522,897 priority patent/US7725763B2/en
Priority to JP2004526954A priority patent/JP2005535044A/ja
Publication of WO2004015574A2 publication Critical patent/WO2004015574A2/fr
Publication of WO2004015574A3 publication Critical patent/WO2004015574A3/fr
Publication of WO2004015574B1 publication Critical patent/WO2004015574B1/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage

Abstract

Procédé pour répliquer une application logicielle dans une architecture multi-ordinateurs (cluster), cette application logicielle étant préalablement exécutée sur un premier ordinateur du cluster constituant un nœud primaire ou opérationnel et étant destinée à être répliquée sur au moins un autre ordinateur du cluster constituant un nœud secondaire, comprenant une réplication des ressources associées à cette application logicielle. Ce procédé comprend une mise à jour au fil de l'eau des ressources répliquées par un mécanisme d'introspection dynamique prévu pour fournir la structure de l'application à répliquer, ainsi que le graphe dynamique des ressources et dépendances mises en œuvre.

Claims

REVENDICATIONS MODIFIEES[reçues par le Bureau international le 21 septembre 2004 (21.09.04); revendications originales 1 et 5 remplacées par la revendication modifiée 1 ; revendications originales 2-4 inchangées ; revendications 6-20 inchangées mais renumérotées5-19 (4 pages)]
1. Procédé pour répliquer une application logicielle dans une architecture multi-ordinateurs (cluster) , ladite
5 application logicielle étant préalablement exécutée sur un premier ordinateur dudit cluster constituant un nœud primaire et étant destinée à être répliquée sur au moins un autre ordinateur dudit cluster constituant un nœud secondaire, comprenant une réplication des ressources 10 associées à ladite application logicielle, caractérisé en ce que les ressources répliquées incluent :
- la mémoire virtuelle de chaque processus concerné ainsi que sa pile d'appel,
- des ressources systèmes (inter process communication, 15 connexion réseau, etc.), et
- des données écrites sur disques; et en ce qu'il comprend en outre une mise à jour au fil de l'eau desdites ressources répliquées par un mécanisme d'introspection dynamique prévu pour fournir la structure de 20 l'application à répliquer, et un graphe dynamique des ressources et dépendances mises en œuvre.
2. Procédé de réplication selon la revendication 1, caractérisé en ce qu'il comprend en outre une création et
25 une maintenance d'un arbre de dépendance, qui fournit à chaque instant des informations sur les ressources qu'il est nécessaire de répliquer.
3. Procédé de réplication selon l'une des revendications 1 30 ou 2, caractérisé en ce qu'il comprend en outre un mécanisme de génération de point de reprise (« chec pointing ») , par lequel les ressources à répliquer sont répliquées sur un ou plusieurs nœuds secondaires -
25
4. Procédé de réplication selon la revendication 3, caractérisé en ce qu'il comprend trois étapes :
- capture des ressources sur le nœud primaire,
- transfert par le réseau vers un ou plusieurs nœuds secondaires, et
- restauration sur le ou les nœuds secondaires.
5. Procédé de réplication selon l'une quelconque des revendications précédentes et la revendication 3, caractérisé en ce qu'il comprend en outre un mécanisme d'optimisation du mécanisme de génération de point de reprise .
6. Procédé de réplication selon la revendication 5, caractérisé en ce que le mécanisme de « checkpointing » est incrémental .
7. Procédé de réplication selon l'une des revendications 5 ou 6, caractérisé en ce que le mécanisme de « checkpointing » est discriminant.
8. Procédé de réplication selon l'une des revendications 5 à 7, caractérisé en ce que le mécanisme de « checkpointing » inclut au moins l'une des fonctions suivantes : - une barrière de synchronisation de processus (PSB) ,
- une gestion de ressources (RM) ,
- une gestion de ressources système (SRM),et
- une gestion de ressources de processus (PRM) .
9. Procédé de réplication selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend en outre un mécanisme de réplication de fichiers de données applicatives entre un nœud opérationnel (OP) sur lequel l'application est exécutée et un nœud dit de stand-by (SB) .
10. Procédé pour réaliser une continuité de fonctionnement d'une application logicielle dans une architecture multi- ordinateurs (cluster) , cette application étant exécutée à un instant donné sur l'un des ordinateurs du cluster, appelé nœud primaire ou opérationnel, les autres ordinateurs dudit cluster étant appelés nœuds secondaires, ce procédé mettant en œuvre le procédé de réplication selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend les étapes suivantes :
- réplication de l'application sur au moins des nœuds secondaires, de façon à réaliser au moins un clone de ladite application,
- mise à jour au fil de l'eau dudit ou desdits clones, et en cas de détection d'une défaillance ou d'un événement affectant ledit nœud opérationnel, basculement de service vers l'un au moins desdits clones.
11. Procédé de continuité de fonctionnement selon la revendication 10, caractérisé en ce que la réplication de l'application est de nature holistique.
12. Procédé de continuité de fonctionnement selon l'une revendication 10 ou 11, caractérisé en ce qu'il comprend en outre une mise à jour des clones de l'application.
13. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 12 , caractérisé en ce qu'il comprend en outre une supervision de l'état de ressources nécessairement au fonctionnement de l'application.
14. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 13, caractérisé en ce qu'il comprend en
27 outre, à la suite d'une détection d'une défaillance ou d'un événement affectant le nœud opérationnel, une étape pour élire, parmi des clones installés sur des nœuds secondaires, un clone pour être substitué à l'application initiale, le nœud sur lequel ledit clone élu est installé devenant le nouveau nœud opérationnel.
15. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 14 , caractérisé en ce qu'il comprend en outre un enregistrement sur chaque clone de messages reçus par le nœud primaire ou opérationnel, ces messages étant réinjectés dans le clone élu nouvel opérationnel en cas de basculement .
16. Système multi-ordinateurs prévu pour exécuter sur au moins desdits ordinateurs au moins une application logicielle, implémentant le procédé pour réaliser une continuité de fonctionnement selon l'une quelconque des revendications 11 à 15.
17. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une optimisation automatique de ressources informatiques par partage de charge par répartition dynamique de processus.
18. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une maintenance non interruptive par relocation à la demande de processus au travers d'un réseau de ressources informatiques.
19. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une préservation de contexte applicatif dans des applications mobiles.
28
PCT/FR2003/002371 2002-08-02 2003-07-28 Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs WO2004015574A2 (fr)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CA2493407A CA2493407C (fr) 2002-08-02 2003-07-28 Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe
DE60328100T DE60328100D1 (de) 2002-08-02 2003-07-28 Unterbrechungsfreier betrieb durch software-replikation in einer multicomputer-architektur
AU2003273481A AU2003273481A1 (en) 2002-08-02 2003-07-28 Functional continuity by replicating a software application in a multi-computer architecture
AT03755641T ATE434790T1 (de) 2002-08-02 2003-07-28 Unterbrechungsfreier betrieb durch software- replikation in einer multicomputer-architektur
EP03755641A EP1529259B1 (fr) 2002-08-02 2003-07-28 Continuite de fonctionnement par replication d'un logiciel dans une architecture multi-ordinateurs
US10/522,897 US7725763B2 (en) 2002-08-02 2003-07-28 Functional continuity by replicating a software application in a multi-computer architecture
JP2004526954A JP2005535044A (ja) 2002-08-02 2003-07-28 マルチコンピュータ・アーキテクチャにおけるソフトウェアの模写による作動の連続性

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0209855A FR2843209B1 (fr) 2002-08-02 2002-08-02 Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe.
FR02/09855 2002-08-02

Publications (3)

Publication Number Publication Date
WO2004015574A2 WO2004015574A2 (fr) 2004-02-19
WO2004015574A3 WO2004015574A3 (fr) 2004-09-02
WO2004015574B1 true WO2004015574B1 (fr) 2004-12-16

Family

ID=30129640

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2003/002371 WO2004015574A2 (fr) 2002-08-02 2003-07-28 Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs

Country Status (9)

Country Link
US (1) US7725763B2 (fr)
EP (1) EP1529259B1 (fr)
JP (1) JP2005535044A (fr)
AT (1) ATE434790T1 (fr)
AU (1) AU2003273481A1 (fr)
CA (1) CA2493407C (fr)
DE (1) DE60328100D1 (fr)
FR (1) FR2843209B1 (fr)
WO (1) WO2004015574A2 (fr)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9213609B2 (en) * 2003-12-16 2015-12-15 Hewlett-Packard Development Company, L.P. Persistent memory device for backup process checkpoint states
US20050216552A1 (en) * 2004-03-24 2005-09-29 Samuel Fineberg Communication-link-attached persistent memory system
US7475296B2 (en) * 2004-05-20 2009-01-06 International Business Machines Corporation Serviceability and test infrastructure for distributed systems
FR2872605B1 (fr) * 2004-06-30 2006-10-06 Meiosys Sa Procede de gestion d'un processus logiciel, procede et systeme de redistribution ou de continuite de fonctionnement dans une architecture multi-ordinateurs
US8122280B2 (en) 2004-08-26 2012-02-21 Open Invention Network, Llc Method and system for providing high availability to computer applications
US7293200B2 (en) * 2004-08-26 2007-11-06 Availigent, Inc. Method and system for providing transparent incremental and multiprocess checkpointing to computer applications
FR2881244B1 (fr) * 2005-01-24 2007-05-04 Meiosys Soc Par Actions Simpli Procede de comptage d'instructions pour journalisation et rejeu d'une sequence d'evenements deterministes
JP5102634B2 (ja) * 2005-01-28 2012-12-19 インターナショナル・ビジネス・マシーンズ・コーポレーション 決定的イベント・シーケンスのロギングおよび再生のための命令をカウントする方法
FR2882165B1 (fr) * 2005-02-11 2007-06-29 Airbus France Sas Systeme et procede de traitements embarques d'essais en vol
FR2883083B1 (fr) * 2005-03-14 2007-05-04 Meiosys Soc Par Actions Simpli Procede d'execution d'une application dans un conteneur virtuel formant une session d'environnement virtualise
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
US9043640B1 (en) * 2005-08-26 2015-05-26 Open Invention Network, LLP System and method for event-driven live migration of multi-process applications
US8752049B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and computer readable medium for providing checkpointing to windows application groups
US8281184B1 (en) 2010-08-06 2012-10-02 Open Invention Network Llc System and method for reliable non-blocking messaging for multi-process application replication
US9286109B1 (en) * 2005-08-26 2016-03-15 Open Invention Network, Llc Method and system for providing checkpointing to windows application groups
US8584145B1 (en) 2010-08-06 2013-11-12 Open Invention Network, Llc System and method for dynamic transparent consistent application-replication of multi-process multi-threaded applications
US8301700B1 (en) 2010-08-06 2012-10-30 Open Invention Network Llc System and method for event-driven live migration of multi-process applications
US8078910B1 (en) 2008-12-15 2011-12-13 Open Invention Network, Llc Method and system for providing coordinated checkpointing to a group of independent computer applications
US9141481B1 (en) * 2010-08-06 2015-09-22 Open Invention Network, Llc System and method for reliable non-blocking messaging for multi-process application replication
US8195722B1 (en) 2008-12-15 2012-06-05 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US8621275B1 (en) 2010-08-06 2013-12-31 Open Invention Network, Llc System and method for event-driven live migration of multi-process applications
US8589953B1 (en) * 2010-08-06 2013-11-19 Open Invention Network, Llc System and method for transparent consistent application-replication of multi-process multi-threaded applications
US7681075B2 (en) 2006-05-02 2010-03-16 Open Invention Network Llc Method and system for providing high availability to distributed computer applications
US20070174484A1 (en) * 2006-01-23 2007-07-26 Stratus Technologies Bermuda Ltd. Apparatus and method for high performance checkpointing and rollback of network operations
US20070234342A1 (en) * 2006-01-25 2007-10-04 Flynn John T Jr System and method for relocating running applications to topologically remotely located computing systems
US7904886B2 (en) * 2006-03-13 2011-03-08 International Business Machines Corporation Method for executing an application in a virtual container forming a virtualized environment session
US7613749B2 (en) 2006-04-12 2009-11-03 International Business Machines Corporation System and method for application fault tolerance and recovery using topologically remotely located computing devices
GB0611038D0 (en) * 2006-06-02 2006-07-12 Ibm Apparatus and method for cluster recovery
US8117604B2 (en) * 2006-07-31 2012-02-14 International Business Machines Corporation Architecture cloning for power PC processors
US7594138B2 (en) 2007-01-31 2009-09-22 International Business Machines Corporation System and method of error recovery for backup applications
US9384159B2 (en) 2007-05-24 2016-07-05 International Business Machines Corporation Creating a checkpoint for a software partition in an asynchronous input/output environment
US9473598B2 (en) * 2007-12-18 2016-10-18 International Business Machines Corporation Network connection failover during application service interruption
US7996094B2 (en) * 2008-09-09 2011-08-09 Rockwell Automation Technologies, Inc. Usage of a virtual unit
US8752048B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and system for providing checkpointing to windows application groups
US8826070B1 (en) 2008-12-15 2014-09-02 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US9256496B1 (en) 2008-12-15 2016-02-09 Open Invention Network, Llc System and method for hybrid kernel—and user-space incremental and full checkpointing
US8341631B2 (en) 2009-04-10 2012-12-25 Open Invention Network Llc System and method for application isolation
US8281317B1 (en) 2008-12-15 2012-10-02 Open Invention Network Llc Method and computer readable medium for providing checkpointing to windows application groups
US8880473B1 (en) 2008-12-15 2014-11-04 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US9354977B1 (en) * 2008-12-15 2016-05-31 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
US10019327B1 (en) 2008-12-15 2018-07-10 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
US8745442B1 (en) * 2011-04-28 2014-06-03 Open Invention Network, Llc System and method for hybrid kernel- and user-space checkpointing
US9058599B1 (en) 2009-04-10 2015-06-16 Open Invention Network, Llc System and method for usage billing of hosted applications
US11538078B1 (en) 2009-04-10 2022-12-27 International Business Machines Corporation System and method for usage billing of hosted applications
US9003360B1 (en) * 2009-12-10 2015-04-07 The Mathworks, Inc. Configuring attributes using configuration subgraphs
US9195500B1 (en) 2010-02-09 2015-11-24 F5 Networks, Inc. Methods for seamless storage importing and devices thereof
US9135127B1 (en) 2010-08-06 2015-09-15 Open Invention Network, Llc System and method for dynamic transparent consistent application-replication of multi-process multi-threaded applications
US9286298B1 (en) * 2010-10-14 2016-03-15 F5 Networks, Inc. Methods for enhancing management of backup data sets and devices thereof
US11307941B1 (en) 2011-04-28 2022-04-19 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
US11625307B1 (en) 2011-04-28 2023-04-11 International Business Machines Corporation System and method for hybrid kernel- and user-space incremental and full checkpointing
KR101249719B1 (ko) * 2011-05-04 2013-04-03 주식회사 인프라웨어테크놀러지 어플리케이션 클론 실행 방법, 컴퓨터로 판독가능한 기록매체, 및 이를 지원하는 클론단말
US9020912B1 (en) 2012-02-20 2015-04-28 F5 Networks, Inc. Methods for accessing data in a compressed file system and devices thereof
US8984336B1 (en) * 2012-02-20 2015-03-17 Symantec Corporation Systems and methods for performing first failure data captures
US9104645B2 (en) 2012-07-27 2015-08-11 Dell Products, Lp System and method of replicating virtual machines for live migration between data centers
US8935568B2 (en) 2012-07-27 2015-01-13 Dell Products, Lp System and method of replicating virtual machines for live migration between data centers
US9201649B2 (en) * 2012-10-26 2015-12-01 Inforsys Limited Systems and methods for estimating an impact of changing a source file in a software
US9251002B2 (en) 2013-01-15 2016-02-02 Stratus Technologies Bermuda Ltd. System and method for writing checkpointing data
US9298790B2 (en) * 2013-01-18 2016-03-29 Microsoft Technology Licensing, Llc Replication of assets across data centers
US10719562B2 (en) 2013-12-13 2020-07-21 BloomReach Inc. Distributed and fast data storage layer for large scale web data services
US9760442B2 (en) 2013-12-30 2017-09-12 Stratus Technologies Bermuda Ltd. Method of delaying checkpoints by inspecting network packets
WO2015102873A2 (fr) 2013-12-30 2015-07-09 Stratus Technologies Bermuda Ltd. Systèmes et procédés de points de contrôle dynamiques
EP3090336A1 (fr) 2013-12-30 2016-11-09 Paul A. Leveille Systèmes et procédés d'établissement de points de reprise au moyen d'un réacheminement de données
US10834065B1 (en) 2015-03-31 2020-11-10 F5 Networks, Inc. Methods for SSL protected NTLM re-authentication and devices thereof
US10228962B2 (en) 2015-12-09 2019-03-12 Commvault Systems, Inc. Live synchronization and management of virtual machines across computing and virtualization platforms and using live synchronization to support disaster recovery
US10387266B2 (en) * 2015-12-23 2019-08-20 Commvault Systems, Inc. Application-level live synchronization across computing platforms including synchronizing co-resident applications to disparate standby destinations and selectively synchronizing some applications and not others
US10404698B1 (en) 2016-01-15 2019-09-03 F5 Networks, Inc. Methods for adaptive organization of web application access points in webtops and devices thereof
US11308109B2 (en) * 2018-10-12 2022-04-19 International Business Machines Corporation Transfer between different combinations of source and destination nodes
US11188386B2 (en) * 2019-11-01 2021-11-30 Sap Portals Israel Ltd. Lightweight remote process execution
US11327663B2 (en) 2020-06-09 2022-05-10 Commvault Systems, Inc. Ensuring the integrity of data storage volumes used in block-level live synchronization operations in a data storage management system
US20220382478A1 (en) * 2021-06-01 2022-12-01 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for page migration in memory systems

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852724A (en) * 1996-06-18 1998-12-22 Veritas Software Corp. System and method for "N" primary servers to fail over to "1" secondary server
US6014686A (en) * 1996-06-21 2000-01-11 Telcordia Technologies, Inc. Apparatus and methods for highly available directory services in the distributed computing environment
US6360331B2 (en) * 1998-04-17 2002-03-19 Microsoft Corporation Method and system for transparently failing over application configuration information in a server cluster
US6363416B1 (en) * 1998-08-28 2002-03-26 3Com Corporation System and method for automatic election of a representative node within a communications network with built-in redundancy
US6438705B1 (en) * 1999-01-29 2002-08-20 International Business Machines Corporation Method and apparatus for building and managing multi-clustered computer systems
US7028217B2 (en) * 2001-06-04 2006-04-11 Lucent Technologies Inc. System and method of general purpose data replication between mated processors
US7093013B1 (en) * 2002-06-19 2006-08-15 Alcatel High availability system for network elements
US7134044B2 (en) * 2002-08-16 2006-11-07 International Business Machines Corporation Method, system, and program for providing a mirror copy of data
US7058846B1 (en) * 2002-10-17 2006-06-06 Veritas Operating Corporation Cluster failover for storage management services
JP4315016B2 (ja) * 2004-02-24 2009-08-19 株式会社日立製作所 コンピュータシステムの系切替方法
US7743372B2 (en) * 2005-06-28 2010-06-22 Internatinal Business Machines Corporation Dynamic cluster code updating in logical partitions
US7761573B2 (en) * 2005-12-07 2010-07-20 Avaya Inc. Seamless live migration of virtual machines across optical networks

Also Published As

Publication number Publication date
US20050251785A1 (en) 2005-11-10
CA2493407A1 (fr) 2004-02-19
AU2003273481A8 (en) 2004-02-25
FR2843209B1 (fr) 2006-01-06
ATE434790T1 (de) 2009-07-15
AU2003273481A1 (en) 2004-02-25
EP1529259B1 (fr) 2009-06-24
FR2843209A1 (fr) 2004-02-06
JP2005535044A (ja) 2005-11-17
WO2004015574A3 (fr) 2004-09-02
EP1529259A2 (fr) 2005-05-11
CA2493407C (fr) 2010-05-11
DE60328100D1 (de) 2009-08-06
US7725763B2 (en) 2010-05-25
WO2004015574A2 (fr) 2004-02-19

Similar Documents

Publication Publication Date Title
WO2004015574B1 (fr) Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs
US10735509B2 (en) Systems and methods for synchronizing microservice data stores
US8055937B2 (en) High availability and disaster recovery using virtualization
US5805897A (en) System and method for remote software configuration and distribution
US9569480B2 (en) Method and system for stateful recovery and self-healing
JP4204769B2 (ja) フェールオーバを処理するシステムおよび方法
Leon et al. Fail-safe PVM: A portable package for distributed programming with transparent recovery
US7707573B1 (en) Systems and methods for providing and installing software
US6360331B2 (en) Method and system for transparently failing over application configuration information in a server cluster
US20050060608A1 (en) Maximizing processor utilization and minimizing network bandwidth requirements in throughput compute clusters
Adya et al. Thialfi: a client notification service for internet-scale applications
US20020194015A1 (en) Distributed database clustering using asynchronous transactional replication
US7870248B2 (en) Exploiting service heartbeats to monitor file share
US20050125445A1 (en) High performance support for XA protocols in a clustered shared database
Saridakis A System of Patterns for Fault Tolerance.
US20190266016A1 (en) Intelligent scheduling of backups
Kaashoek et al. Transparent fault-tolerance in parallel Orca programs
Hariri et al. Architectural support for designing fault-tolerant open distributed systems
Du et al. MPI-Mitten: Enabling migration technology in MPI
Caromel et al. Peer-to-Peer and fault-tolerance: Towards deployment-based technical services
US20230305947A1 (en) Using clusters to create test instances
Srivastava et al. Architectural support for mode-driven fault tolerance in distributed applications
US9959180B1 (en) Systems and methods for shipping an I/O operation to prevent replication failure
de Sousa et al. A flexible fault-tolerance mechanism for the integrade grid middleware
Yasinian et al. Messaging techniques (MPI) in grid environment: a survey

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
B Later publication of amended claims

Effective date: 20040921

WWE Wipo information: entry into national phase

Ref document number: 2493407

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2004526954

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 10522897

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2003755641

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2003755641

Country of ref document: EP