]> Creatis software - gdcm.git/blob - src/gdcmDocument.h
// fix definitively any misuse of LoadMode !
[gdcm.git] / src / gdcmDocument.h
1 /*=========================================================================
2  
3   Program:   gdcm
4   Module:    $RCSfile: gdcmDocument.h,v $
5   Language:  C++
6   Date:      $Date: 2011/04/27 13:40:04 $
7   Version:   $Revision: 1.155 $
8  
9   Copyright (c) CREATIS (Centre de Recherche et d'Applications en Traitement de
10   l'Image). All rights reserved. See Doc/License.txt or
11   http://www.creatis.insa-lyon.fr/Public/Gdcm/License.html for details.
12  
13      This software is distributed WITHOUT ANY WARRANTY; without even
14      the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR
15      PURPOSE.  See the above copyright notices for more information.
16  
17 =========================================================================*/
18
19 #ifndef _GDCMDOCUMENT_H_
20 #define _GDCMDOCUMENT_H_
21
22 #include "gdcmVR.h"
23 #include "gdcmDict.h"
24 #include "gdcmElementSet.h"
25 #include "gdcmException.h"
26 #include "gdcmDebug.h"  // for LEGACY
27 #include "gdcmCommandManager.h"
28
29 #include <map>
30 #include <list>
31 #include <fstream>
32
33 namespace GDCM_NAME_SPACE 
34 {
35 class SeqEntry;
36 class Dict;
37
38 //-----------------------------------------------------------------------------
39 /**
40  * \brief Derived by both GDCM_NAME_SPACE::File and GDCM_NAME_SPACE::DicomDir
41  */
42 class GDCM_EXPORT Document : public ElementSet
43 {
44    gdcmTypeMacro(Document);
45
46 public:
47    typedef std::list<DicomElement> ListElements;
48
49 // Loading
50    //Deprecated : use SetFileName() + Load()
51 //#ifndef GDCM_LEGACY_REMOVE 
52 //   virtual bool Load( std::string const &filename ); 
53 //#endif
54    virtual bool Load( ); 
55
56 // Dictionaries
57    Dict *GetPubDict();
58    Dict *GetShaDict();
59    bool SetShaDict(Dict *dict);
60    bool SetShaDict(DictKey const &dictName);
61
62 // Informations contained in the GDCM_NAME_SPACE::Document
63    bool IsParsable();
64    virtual bool IsReadable();
65    bool IsDicomV3();
66    bool IsPapyrus();
67    FileType GetFileType();
68    std::string GetTransferSyntax();
69    /// Return the Transfer Syntax as a string
70    std::string GetTransferSyntaxName();
71
72 // Swap code
73    /// 'Swap code' accessor (see  SwapCode )
74    int GetSwapCode() { return SwapCode; }
75    
76 // File I/O
77    /// Accessor to  Filename
78    const std::string &GetFileName() const { return Filename; }
79    /// Accessor to  Filename
80    virtual void SetFileName(std::string const &fileName) 
81                    { if (Filename != fileName)
82                         Filename = fileName, IsDocumentModified = true; }
83
84    std::ifstream *OpenFile();
85    bool CloseFile();
86    void WriteContent( std::ofstream *fp, FileType type, bool insideMetaElements, bool insideSequence );
87
88 // Data entries
89    virtual void LoadEntryBinArea(uint16_t group, uint16_t elem);
90    virtual void LoadEntryBinArea(DataEntry *entry);
91
92    void SetMaxSizeLoadEntry(long);
93    void AddForceLoadElement(uint16_t group, uint16_t elem);
94
95 // Ordering of Documents
96    bool operator<(Document &document);
97
98 /**
99  * \brief Sets the LoadMode as a boolean string.
100  *        LD_NOSEQ, LD_NOSHADOW, LD_NOSHADOWSEQ
101  ... (nothing more, right now)
102  *        WARNING : before using NO_SHADOW, be sure *all* your files
103  *        contain accurate values in the 0x0000 element (if any)
104  *        of *each* Shadow Group. The parser will fail if the size is wrong !
105  * @param   mode Load mode to be used
106  */
107    void SetLoadMode (int mode) { 
108    //if (LoadMode != mode)
109    //    LoadMode=mode, IsDocumentModified = true;
110    
111    // fix definitively any misuse of LoadMode !
112    LoadMode = 0;
113 }
114
115 protected:
116 // Methods
117    // Constructor and destructor are protected to forbid end user
118    // to instanciate from this class Document (only GDCM_NAME_SPACE::File and
119    // GDCM_NAME_SPACE::DicomDir are meaningfull).
120    Document();
121    virtual ~Document();
122
123    virtual void CallStartMethod();
124    virtual void CallProgressMethod();
125    virtual void CallEndMethod();
126       
127    uint16_t ReadInt16() throw ( FormatError );
128    uint32_t ReadInt32() throw ( FormatError );
129
130    /// \brief skips bytes inside the source file
131    void     SkipBytes(uint32_t nBytes) { Fp->seekg((long)nBytes, std::ios::cur);}
132    int ComputeGroup0002Length( );
133
134 // Variables
135    /// Refering underlying filename.
136    std::string Filename;
137
138    /// \brief Swap code gives an information on the byte order of a 
139    ///  supposed to be an int32, as it's read on disc 
140    /// (depending on the image Transfer Syntax *and* on the processor endianess)
141    /// as opposed as it should in memory to be dealt as an int32.
142    /// For instance :
143    /// - a 'Little Endian' image, read with a little endian processor
144    /// will have a SwapCode= 1234 (the order is OK; nothing to do)
145    /// - a 'Little Endian' image, read with a big endian procesor
146    /// will have a SwapCode= 4321 (the order is wrong; int32 an int16 must be
147    /// swapped)
148    /// note : values 2143, 4321, 3412 remain for the ACR-NEMA time, and
149    /// the well known 'Bad Big Endian' and 'Bad Little Endian' codes
150    int SwapCode;
151
152    ///\brief whether we already parsed group 0002 (Meta Elements)
153    bool Group0002Parsed;
154
155    ///\brief whether file has a DCM Preamble
156    bool HasDCMPreamble;
157
158    /// File Pointer, opened during Document parsing.
159    std::ifstream *Fp;
160
161    /// ACR, ACR_LIBIDO, ExplicitVR, ImplicitVR, Unknown
162    FileType Filetype;  
163
164    /// After opening the file, we read HEADER_LENGTH_TO_READ bytes.
165    static const unsigned int HEADER_LENGTH_TO_READ; 
166    /// \brief Elements whose value is longer than MAX_SIZE_LOAD_ELEMENT_VALUE
167    /// are NOT loaded.
168    static const unsigned int MAX_SIZE_LOAD_ELEMENT_VALUE;
169
170    /// User supplied list of elements to Anonymize
171    ListElements UserAnonymizeList;
172
173    /// User supplied list of elements to force Load
174    ListElements UserForceLoadList;
175
176    /// \brief Bit string integer (each one considered as a boolean)
177    ///        Bit 0 : Skip Sequences,    if possible
178    ///        Bit 1 : Skip Shadow Groups if possible
179    ///        Probabely, some more to add
180    int LoadMode;
181    
182    /// \brief Whether the GDCM_NAME_SPACE::Document is already parsed/loaded :
183    /// False from the creation of the GDCM_NAME_SPACE::Document untill 
184    ///   GDCM_NAME_SPACE::Document:Load()
185    bool IsDocumentAlreadyLoaded; // FIXME : probabely useless now
186
187    /// Whether the GDCM_NAME_SPACE::Document was modified since the last Load()
188    bool IsDocumentModified;
189
190 private:
191 // Methods
192    void Initialize();
193    bool DoTheLoadingDocumentJob();
194      
195       // System access (meaning endian related !?)
196    void ReadBegBuffer(size_t l) throw ( FormatError );
197    uint16_t SwapShort(uint16_t);
198    uint32_t SwapLong(uint32_t);
199    double SwapDouble(double);
200    /// \brief  Unswaps back the bytes of 2-bytes long integer 
201    ///         so they agree with the processor order.
202    uint16_t UnswapShort(uint16_t a) { return SwapShort(a);}
203    /// \brief  Unswaps back the bytes of 4-byte long integer 
204    ///         so they agree with the processor order.
205    uint32_t UnswapLong(uint32_t a) { return SwapLong(a);}
206    
207    // Read
208    void ParseDES(DocEntrySet *set, long offset, long l_max, bool delim_mode);
209    bool ParseSQ (SeqEntry *seq,    long offset, long l_max, bool delim_mode);
210
211    void LoadDocEntry         (DocEntry *e, bool forceLoad = false);
212    void FindDocEntryLength   (DocEntry *e) throw ( FormatError );
213    uint32_t FindDocEntryLengthOBOrOW() throw( FormatUnexpected );
214    VRKey FindDocEntryVR();
215    bool CheckDocEntryVR      (const VRKey &k);
216
217    void SkipDocEntry          (DocEntry *entry);
218    void SkipToNextDocEntry    (DocEntry *entry);
219
220    void FixDocEntryFoundLength(DocEntry *entry, uint32_t l);
221    bool IsDocEntryAnInteger   (DocEntry *entry);
222
223    bool CheckSwap();
224    void SwitchByteSwapCode();
225
226    // DocEntry related utilities
227    DocEntry *ReadNextDocEntry();
228    uint16_t GetInt16();
229    uint32_t GetInt32();
230
231    void HandleBrokenEndian  (uint16_t &group, uint16_t &elem);
232    void HandleOutOfGroup0002(uint16_t &group, uint16_t &elem);
233    DocEntry *Backtrack(DocEntry *docEntry, DocEntrySet *set);
234
235 // Variables
236 protected:
237    /// value of the ??? for any progress bar
238    float Progress;
239    mutable bool Abort;
240    
241    /// Public dictionary used to parse this header
242    Dict *RefPubDict;
243    /// \brief Optional "shadow dictionary" (private elements) used to parse
244    /// this header
245    Dict *RefShaDict;
246
247    /// \brief Size threshold above which an element value will NOT be loaded
248    /// in memory (to avoid loading the image/volume itself). By default,
249    /// this upper bound is fixed to 1024 bytes (which might look reasonable
250    /// when one considers the definition of the various VR contents).
251    uint32_t MaxSizeLoadEntry;
252
253    /// \brief to allow any inner method to know current tag Group number 
254    uint16_t CurrentGroup;
255    /// \brief to allow any inner method to know current tag Element number 
256    uint16_t CurrentElem; 
257      
258 //  uint32_t GenerateFreeTagKeyInGroup(uint16_t group);
259 //  void BuildFlatHashTableRecurse( TagDocEntryHT &builtHT,
260 //                                  DocEntrySet *set );
261
262 private:
263    /// \brief buffer to avoid some freads
264    char BegBuffer[8];
265    char *PtrBegBuffer;
266    /// \brief to avoid time consuming ftellg
267    size_t CurrentOffsetPosition;
268    /// \brief to indicate if last supposed to be UN DataElement is not
269    ///        (according to a private Dicom dictionary) 
270    bool changeFromUN;
271    /// \brief whether an unexpected EOF was encountered
272    bool UnexpectedEOF;
273    /// \brief to avoid infinite loop when illegal UN stands for OB
274    size_t OffsetOfPreviousParseDES;
275 };
276
277 } // end namespace gdcm
278
279 //-----------------------------------------------------------------------------
280 #endif